Masalahnya bukan selalu karena AI "menyimpan" data pribadi secara langsung. Sering kali sistem hanya menyusun informasi dari berbagai sumber seperti:
Ketika AI menggabungkan semua potongan itu dalam satu jawaban, informasi pribadi menjadi jauh lebih mudah ditemukan dibandingkan metode pencarian biasa .
Investigasi dan laporan pengguna menunjukkan beberapa jalur utama bagaimana informasi sensitif bisa muncul.
Model bahasa besar dilatih menggunakan dataset sangat besar yang dapat mencakup halaman web, arsip dokumen, atau catatan pemerintah. Sebagian sumber tersebut berisi nomor telepon atau alamat individu, yang terkadang muncul kembali dalam respons chatbot .
Walaupun data itu mungkin tersedia secara publik, biasanya perlu beberapa pencarian terpisah untuk menemukannya. AI dapat menggabungkan informasi dari berbagai database atau dokumen dan menampilkannya sekaligus .
Dalam beberapa kasus, chatbot tidak mengambil data yang benar tetapi justru mengarang atau salah mengaitkan nomor telepon. Akibatnya nomor orang nyata bisa muncul sebagai kontak layanan pelanggan atau bisnis yang sebenarnya tidak terkait .
Peneliti juga menunjukkan bahwa pengguna dapat mempersempit pertanyaan secara bertahap sehingga sistem akhirnya mengungkap detail sensitif yang sebelumnya diblokir oleh filter keamanan .
Walau penelitian sistematis masih terbatas, beberapa insiden yang dilaporkan menunjukkan dampak nyata dari AI doxxing.
• Orang asing menelepon setelah mendapat nomor dari AI — Beberapa korban mengatakan mereka menerima telepon dari orang yang mengaku menemukan nomor tersebut lewat chatbot saat mencari layanan seperti pengacara atau tukang kunci .
• "AI memberi saya nomor Anda" — Seorang korban melaporkan penelepon berulang kali mengatakan chatbot memberikan nomor teleponnya sebagai kontak layanan yang tidak ada hubungannya dengan dirinya .
• Pengembang software menerima panggilan salah alamat — Dalam kasus lain, seorang pengembang di Israel mulai menerima banyak panggilan pelanggan setelah AI memberikan nomor pribadinya sebagai kontak layanan bantuan .
• Peneliti berhasil mengekstrak data pribadi — Peneliti universitas menunjukkan bahwa dengan rangkaian pertanyaan tertentu, chatbot bisa mengungkap nomor ponsel rekan kerja atau alamat rumah seorang profesor .
• Alamat rumah muncul dari pertanyaan sederhana — Investigasi juga menemukan beberapa chatbot dapat memberikan alamat rumah individu ketika diminta dengan nama mereka .
Contoh-contoh ini menunjukkan bahwa bahkan kebocoran yang tidak disengaja dapat menimbulkan konsekuensi nyata.
Sebelum era asisten AI, banyak informasi pribadi berada dalam kondisi yang disebut “practical obscurity”—secara teknis publik tetapi sulit ditemukan.
Misalnya, seseorang mungkin harus mencari di beberapa database pemerintah atau arsip dokumen lama untuk menemukan alamat tertentu.
Chatbot AI mengurangi hambatan tersebut. Dengan satu pertanyaan sederhana, sistem dapat melakukan pencarian, analisis, dan rangkuman secara otomatis sehingga informasi muncul langsung dalam jawaban .
Karena itu, sebagian peneliti khawatir AI pada praktiknya dapat bertindak seperti broker data otomatis, yang mempermudah akses ke informasi sensitif dalam skala besar.
Menghapus data pribadi dari sistem AI bukan tugas mudah.
Nomor telepon atau alamat dapat muncul di berbagai sumber: arsip web, dokumen pemerintah, direktori lama, dan dataset pelatihan. Menghapus satu sumber tidak selalu cukup .
Model bahasa tidak menyimpan informasi sebagai tabel data sederhana. Mereka mempelajari pola statistik dari teks, sehingga penghapusan informasi tertentu setelah pelatihan menjadi sulit.
Perusahaan AI sering menambahkan filter untuk memblokir permintaan informasi kontak pribadi. Namun laporan menunjukkan hasilnya bisa berbeda tergantung cara pertanyaan diajukan .
Peneliti juga mencatat bahwa kebijakan privasi sistem AI sering sulit dipahami oleh pengguna, sehingga banyak orang tidak tahu bagaimana data mereka digunakan atau bagaimana meminta penghapusannya .
Para ahli privasi dan pengembang AI sedang mencoba beberapa pendekatan untuk mengurangi risiko.
Mengurangi data sensitif saat pelatihan — Peneliti menyarankan perusahaan menghindari sumber yang berpotensi berisi nomor telepon atau alamat pribadi jika memungkinkan .
Pengujian keamanan yang lebih ketat — Sistem AI diuji dengan berbagai prompt yang mencoba memancing doxxing agar pengembang dapat memperbaiki perlindungan .
Memblokir output sensitif — Beberapa chatbot kini menolak memberikan nomor telepon pribadi atau alamat rumah, bahkan jika informasi tersebut tersedia secara publik .
Proses pelaporan yang lebih cepat — Para ahli juga mendorong mekanisme yang jelas agar individu dapat melaporkan dan meminta penghapusan data pribadi dari respons AI .
Meski demikian, karena ukuran dataset pelatihan yang sangat besar dan kompleksitas model AI modern, para peneliti memperingatkan bahwa menghilangkan risiko ini sepenuhnya kemungkinan akan tetap menjadi tantangan.
Kemunculan AI doxxing menunjukkan perubahan besar dalam cara informasi pribadi beredar.
Data tersebut mungkin tidak pernah benar-benar rahasia. Namun kecepatan, otomatisasi, dan kemudahan bertanya pada chatbot membuat informasi yang sebelumnya tersembunyi menjadi sangat mudah diakses.
Seiring AI semakin terintegrasi ke mesin pencari, aplikasi pesan, dan berbagai layanan digital, banyak peneliti menilai bahwa perlindungan privasi yang lebih kuat dan aturan data yang lebih jelas akan menjadi semakin penting untuk mencegah penyalahgunaan di masa depan .
Comments
0 comments