सबसे सुरक्षित कसौटी AI का नाम नहीं है। असली कसौटी चार बातों की है: डेटा कितना संवेदनशील है, सेवा उस डेटा को कैसे रखती या इस्तेमाल करती है, आपका संगठन इसकी अनुमति देता है या नहीं, और कुछ गड़बड़ होने पर ट्रैकिंग व सुधार संभव है या नहीं। NIST डेटा सुरक्षा, डेटा-रिटेंशन, monitoring, incident response, opt-out और risk-based controls को जनरेटिव AI governance में रखता है; इनका जवाब न हो, तो मूल डेटा अपलोड न करें।
अगर इनमें से किसी एक सवाल का भी साफ जवाब नहीं है, तो कच्चा दस्तावेज़ पब्लिक AI में न डालें।
Prompt में केवल यह लिख देना कि कृपया इसे गोपनीय रखें, सुरक्षा नियंत्रण नहीं है। असली नियंत्रण यह है कि डेटा कहाँ सेव होगा, कौन access कर सकता है, reuse से बाहर निकलने का विकल्प है या नहीं, घटना पर जिम्मेदारी किसकी होगी और आपका संगठन इस उपयोग को अनुमति देता है या नहीं।
नीचे की सूची कानूनी सलाह नहीं है। इसे data protection, retention और risk-based governance के व्यावहारिक रूप में पढ़ें। अंतिम फैसला हमेशा आपके संगठन की IT, cyber security, legal, privacy और records-management policy के अनुसार होना चाहिए।
सार्वजनिक होने का अर्थ zero risk नहीं है। अगर सार्वजनिक सामग्री में भी निजी या संवेदनशील जानकारी है, तो privacy risk और data protection के नियम लागू रहेंगे।
ऐसे डेटा पर AI का उपयोग हमेशा असंभव नहीं है, लेकिन बिना मंज़ूरी, बिना retention rules, बिना monitoring और बिना incident response mechanism के इसे पब्लिक AI में डालना सही तरीका नहीं है।
कई बार लोग नाम हटाकर समझ लेते हैं कि डेटा सुरक्षित हो गया। लेकिन ID नंबर, फोन, ईमेल, पता, account number, case number, दुर्लभ job title, तारीख और स्थान का खास combination भी किसी व्यक्ति या मामले तक पहुंचा सकता है। EDPB का एक प्रमुख फोकस LLM systems में privacy risks और mitigations है; इसलिए upload से पहले identifiable details, वापस जोड़कर पहचान कराने वाली जानकारी और गैर-जरूरी field हटाना या बदलना जरूरी है।
व्यावहारिक तरीका यह हो सकता है: असली नामों को व्यक्ति A, कंपनी X जैसे labels से बदलें; सिर्फ जरूरी अंश दें; मूल दस्तावेज़ को abstract scenario में बदलें; lists, logs या tables को पहले aggregate करें; और अगर असली दस्तावेज़ पर ही काम कराना आवश्यक हो, तो संगठन द्वारा मंज़ूर tool और controlled workflow का उपयोग करें।
सार्वजनिक क्षेत्र में जनरेटिव AI का प्रश्न केवल हाँ या नहीं का नहीं है। JRC की Generative AI Outlook रिपोर्ट public sector use को अलग deep-dive क्षेत्र के रूप में देखती है; यूरोपीय संसद के annex में एक उदाहरण official Bundestag data के इस्तेमाल और personal या sensitive information से बचने की बात करता है।
आम तौर पर विचार करने योग्य सामग्री वह हो सकती है जो पहले से सार्वजनिक, कम-संवेदनशील और कानूनन उपयोग योग्य हो। अधिक सावधानी वाली श्रेणी में आती हैं: अप्रकाशित सरकारी पत्र, internal noting, policy drafts, investigation material, enforcement data, procurement evaluation records और कोई भी फाइल जिसमें निजी या संवेदनशील जानकारी हो। पहली श्रेणी में भी इस्तेमाल की शर्तें जांचें; दूसरी श्रेणी को सीधे पब्लिक AI में न डालें।
अगर डेटा लीक होने से किसी व्यक्ति, संगठन, सार्वजनिक हित या compliance status को नुकसान हो सकता है, तो उसका मूल रूप पब्लिक AI को न दें। पहले masking, summarization और data minimization करें। अगर काम के लिए असली दस्तावेज़ जरूरी है, तो मंज़ूर प्रक्रिया और controlled tool अपनाएँ, और data protection, data retention, access rights, monitoring और incident response की व्यवस्था स्पष्ट रूप से confirm करें।
Comments
0 comments