Chatbot AI seperti Gemini dan ChatGPT ternyata bisa bocorkan nomor HP pribadi. Ancaman privacy yang bikin resah.
Baru-baru ini, seorang Redditor ngerasa 'desperate banget'. Selama sebulan penuh, HP-nya dihubungi orang asing yang cari pengacara, desainer produk, sampai tukang kunci. Wah, kenapa? ternyata Google AI salah arahin orang ke nomor dia!
Ini bukan satu-satunya kasus. Di Israel, seorang developer kena panggilan WhatsApp karena Gemini kasih instruksi customer service yang salah pakai nomor dia. Di Washington, seorang PhD candidate berhasil bikin Gemini kasih nomor HP temannya. Gede banget masalah privasi nih!
Para peneliti AI dan ahli privacy udah lama peringatkan bahaya AI generatif untuk privasi pribadi. Kasus-kasus ini jadi lagi satu lagi alasan khawatir: AI bisa bocorkan nomor HP orang lain. Lumayan mengganggu buat yang kena imbasnya.
Advertisement
Slot in-article yang tampil setelah paragraf ketiga.
Para ahli bilang, kebocoran privacy ini paling mungkin gara-gara data pribadi (PII) dipake buat training AI. Tapi susah dipahami mekanismenya persis. Yang jelas, hasilnya nggak menyenangkan buat korban. Bahkan lebih parah, sepertinya nggak ada yang bisa buat berhentinya.
Nah, dari perusahaan yang bantu hapus data pribadi dari internet, DeleteMe, kasus AI-related privacy request naik 400% dalam 7 bulan terakhir. Wah, gede banget! 55% dari keluhan ini soal ChatGPT, 20% Gemini, 15% Claude, dan 10% AI tools lain.
Biasanya, keluhan ini bentuknya dua. Pertama, user tanya sesuatu tentang diri sendiri, tapi AI kasih balasan yang terlalu detail: alamat rumah, nomor HP, nama keluarga, detail kerja. Atau, AI kasih kontak palsu yang terlihat valid tapi salah.
Seperti yang dialami Daniel Abraham, seorang software engineer di Israel. Dia kena panggilan WhatsApp aneh dari orang asing minta bantuan dengan akun PayBox. Awalnya dia pikir spam, tapi ternyata Gemini kasih instruksi customer service pakai nomor HP dia! Padahal dia nggak kerja di PayBox.
Abraham coba cari tahu caranya, dan dia nemu bahwa nomornya pernah di-share online di 2015 di situs lokal mirip Quora. Mungkin dari situ AI pelajari dan kasih balasan yang salah. Kasus ini bikin khawatir soal potensi harassment atau interaksi buruk lainnya.
Chatbot seperti Gemini, ChatGPT, dan Claude dibangun di atas LLM yang di-train dari data besar yang di-scrap dari seluruh web. Tentu ini termasuk jutaan data pribadi. Bahkan, dataset populer seperti DataComp CommonPool udah termasuk copy resume, KTP, dan kartu kredit.
Kemungkinan PII muncul di training AI malah makin besar karena data public 'habis' dan AI company cari sumber data baru. Ini termasuk data dari broker data dan website pencarian orang. Di California saja, 31 dari 578 broker data ngaku udah share data ke developer GenAI.
Model AI dikenal bisa ingat dan reproduksi data persis dari training set. Penelitian terbaru bilang, bukan cuma data yang sering muncul yang diingat, tapi juga data lainnya. Ini bikin masalah privacy makin rumit.
Sekarang, standarnya AI company masang guardrail di LLM mereka, dari filter konten buat ngeluarin PII sampe instruksi Claude buat pilih jawaban yang paling nggak privasi. Tapi, seperti yang dilihat dua PhD student di Washington, proteksi ini nggak selalu berhasil.
Meira Gilbert bilang, 'Saya lagi main-main di Gemini, cari info kontak Yael Eiger, teman dan kolaborator saya.' Tapi Gemini ngasihin nomor HP pribadi temannya! 'Shock banget,' kata Gilbert. Eiger ingat pernah share nomornya online untuk workshop teknologi, tapi nggak terlalu terbuka kayak begini.
Setelah pengalaman ini, mereka coba tes ChatGPT buat lihat apa yang bisa dia kasih tentang seorang profesor. Awalnya, guardrail OpenAI aktif, tapi ChatGPT bilang, 'Kalau mau lebih dalam, saya bisa coba pendekatan 'investigative-style'.' Dia minta 'tebakan lingkungan' atau 'nama co-owner' buat narrowing down.
Setelah mereka kasih info itu, ChatGPT kasih alamat rumah profesor, harga beli rumah, dan nama istri dari catatan properti kota. Wah, ini bahaya banget! Artinya, AI bisa akses data pribadi dengan mudah kalau diminta dengan cara yang tepat.
Seperti bilang Shavell dari DeleteMe, 'AI company bisa pasang guardrail, tapi chatbot juga didesain buat efektif dan jawab pertanyaan user.' Jadi ada konflik antara privasi dan fungsionalitas. Masalah ini ngg cuma terjadi di Gemini atau ChatGPT, tapi juga di Grok dari xAI.
Nah, solusi buat masalah ini nggak straightforward. Tidak ada cara mudah buat verifikasi apakah data pribadi ada di training set tertentu atau paksa model hapus PII. Idealnya, consumer bisa minta data pribadi mereka dihapus, tapi biasanya ini cuma berlaku untuk data yang langsung diberikan ke company.
Privacy legislation seperti California Consumer Privacy Act atau GDPR di Eropa nggangkup 'publicly available information' yang sudah di-scrape dan dipake buat training LLM. Lagipula, banyak data ini sudah di-anonymize, meski penelitian tunjukkan masih mudah di-infer balik identitasnya.
King dari Stanford University bilang, 'Saya nggak tahu apakah Google punya infrastruktur buat bilang, "Ya, kami punya data Anda di training data kami, kami bisa ringkas apa yang kami tahu tentang Anda, lalu hapus atau koreksi yang salah atau yang tidak Anda mau."'
Solusi terbaik mungkin company 'mengeluarkan semua nomor HP atau data yang mirip nomor HP,' tapi 'belum ada yang mau bilang' mereka melakukan ini. Hugging Face punya tool buat cari seberapa sering data tertentu muncul di open-source LLM training data, tapi ini nggak mewakili closed LLM seperti ChatGPT, Gemini, atau Claude.
Untuk sekarang, opsi terbaik buat melindungi data pribadi kamu adalah 'mulai dari hulu: hapus data pribadi dari web public sebelum di-scrape lagi,' bilang Shavell. California udah punya portal web buat minta data broker hapus informasi mereka, tapi ini nggak menjamin data Anda belum dipake buat training.
Redditor yang kena panggilan berulang bilang dia udah submit 'Legal Removal/Privacy Request ke Google' minta nomornya di-blacklist dari LLM output, tapi belum dapat respon. Dia juga bilang 'harassment continues daily.' Abraham di Israel juga nggak dapat respon yang memuaskan dari Google.
Eiger, bersama Gilbert dan Gueorguieva, sekarang sedang merancang penelitian buat studi lebih lanjut tentang informasi pribadi yang muncul di berbagai chatbot AI - dan apa yang mereka tahu, meski nggak bilang. Gilbert bertanya, 'Apakah generative AI cuma turunkan barrier buat target orang?'
Jadi, apa yang bisa kamu lakukan? Pertama, hati-hati sharing data pribadi di mana saja. Kedua, cek apakah ada portal hapus data di negaramu. Ketiga, waspada kalau chatbot minta info tambahan buat 'investigasi'. Ingat, privasi digital butuh awareness dari kita semua!
AI Updates lagi bergerak cepat, jadi jangan cuma lihat headline.
MIT Technology Review AI
Catatan redaksi
Kalau lo cuma ambil satu hal dari artikel ini
AI Updates update dari MIT Technology Review AI.
Sumber asli
Artikel ini merupakan rewrite editorial dari laporan MIT Technology Review AI.
Baca artikel asli di MIT Technology Review AI→


