只要有一條答唔到,就先唔好將原文放入一般公開型 AI。
刪走姓名未必夠。如果證件號碼、電話、電郵、地址、戶口、案號、罕見職銜、日期加地點的組合,仍然可以指向某個人或案件,私隱風險仍然存在。EDPB 文件關注的核心之一,就是 LLM 系統中的私隱風險與緩解;所以上傳前,應一併移除或改寫可識別資料、可回推細節和非必要欄位。
公共部門用生成式 AI,唔係簡單一句全面禁止或全面開放。JRC 的生成式 AI Outlook 報告把公共部門應用列為專門討論領域;歐洲議會附件中的案例摘要亦提到使用德國聯邦議院 Bundestag 的官方資料,並避免個人或敏感資訊。
較可考慮的,通常是已公開、低敏感、可依法使用的官方資料;需要特別保守的,則包括未公開內部文件、政策草稿、調查資料、執法資料、採購評選資料,以及任何含個人資料或敏感資訊的文件。前者仍要檢查使用條件;後者不應直接放入一般公開型 AI。
如果資料外洩會傷害個人、機構、公共利益或合規狀況,就唔好將原文交畀一般公開型 AI。先遮蔽、摘要、最小化;如果任務真的需要原文,改走批核流程和受控工具,並確認資料保護、資料保留、存取權限、監察和事故應變機制。
Comments
0 comments