Riset terbaru bahas gimana kemampuan Theory of Mind di AI pengaruhnya ke interaksi manusia-AI, ternyata nggak selalu bikin lebih baik.
Pernah denger istilah Theory of Mind (ToM)? Singkatnya, ini kemampuan buat ngerti pikiran dan perasaan orang lain. Nah, di dunia AI, khususnya Large Language Models (LLM), kemampuan ini penting banget supaya AI bisa 'ngerti' kita lebih dalam waktu ngobrol atau kerja bareng.
Tapi, selama ini cara ngukur kemampuan ToM di AI itu biasanya lewat tes yang kaku, kayak baca cerita terus jawab pilihan ganda. Padahal, interaksi manusia dan AI itu dinamis dan sering kali nggak bisa diprediksi, beda banget sama tes yang cuma dari sudut pandang orang ketiga.
Makanya, riset terbaru ini coba pendekatan baru dengan evaluasi ToM yang interaktif. Jadi, AI diuji langsung dalam situasi nyata yang lebih fleksibel dan dari sudut pandang orang pertama, kayak ngobrol langsung sama manusia buat tugas-tugas yang butuh pemahaman sosial.
Advertisement
Slot in-article yang tampil setelah paragraf ketiga.
Mereka juga nyobain empat teknik buat ningkatin ToM di AI, dengan data dan studi pengguna yang bervariasi, dari yang fokus ke tugas spesifik kayak coding dan matematika, sampai yang lebih ke pengalaman kayak konseling. Tujuannya biar hasilnya nggak cuma bagus di tes tapi juga di dunia nyata.
Eh, hasilnya? Ternyata, peningkatan ToM yang keliatan di tes statis nggak selalu bikin AI jadi lebih jago waktu interaksi langsung sama manusia. Ini nunjukin kalau cara ngevaluasi AI harus lebih nyentuh ke interaksi nyata, bukan cuma tes teori doang.
Jadi, buat kamu yang penasaran gimana AI bisa makin pinter 'ngerti' kamu, riset ini kasih insight penting: jangan cuma ngandelin tes standar, tapi harus ada evaluasi yang bener-bener nyoba AI di situasi nyata. Ini bakal bantu bikin AI yang nggak cuma pinter ngomong, tapi juga paham kamu banget.
AI Updates lagi bergerak cepat, jadi jangan cuma lihat headline.
arXiv CS.AI
Catatan redaksi
Kalau lo cuma ambil satu hal dari artikel ini
AI Updates update dari arXiv CS.AI.
Sumber asli
Artikel ini merupakan rewrite editorial dari laporan arXiv CS.AI.
Baca artikel asli di arXiv CS.AI→


