調查同用戶報告指出,AI 出現資料曝光通常有幾種途徑。
雖然目前系統性統計仍然有限,但多宗報道案例顯示問題已經影響現實生活。
呢啲例子顯示,即使只係「意外」披露,都可能迅速造成現實世界影響。
喺 AI 出現之前,很多個人資料處於一種叫**「實際上的模糊」(practical obscurity)**嘅狀態。
意思係:資料 technically 公開,但要花大量時間先找到。例如要逐個政府資料庫或舊網站查。
結果係:原本埋喺文件入面嘅資料,可以喺一個聊天回覆入面即時出現。
有私隱研究員因此形容,AI 有可能變成一種自動化資料經紀(data broker),令敏感資訊更容易被取得。
即使公司想解決 AI 起底問題,技術上亦相當困難。
大型語言模型係以統計方式學習語言模式,而唔係以表格形式儲存資料,因此很難精準刪除某條特定資訊。
私隱研究員同 AI 公司正研究多種方法減低風險:
不過,由於訓練數據規模巨大,加上模型運作方式複雜,研究人員普遍認為要完全消除風險仍然非常困難。
AI doxxing 其實揭示咗一個更深層問題:生成式 AI 可以令原本難以搜尋嘅資訊變得極度容易取得。
資料未必本來是秘密,但AI 的速度、自動化和對話式介面,會放大資料被公開時帶來的影響。
Comments
0 comments