Penulis
KOMPAS.com - Di era kecerdasan buatan (AI), jejak digital bukan lagi sekadar unggahan media sosial, riwayat pencarian, atau transaksi belanja online. Ada satu hal yang jauh lebih intim dan sering luput dari perhatian: suara kita sendiri.
Penelitian terbaru menunjukkan bahwa suara manusia menyimpan jauh lebih banyak informasi pribadi daripada yang kita sadari. Bahkan, teknologi AI berpotensi memanfaatkannya untuk praktik yang merugikan — mulai dari diskriminasi harga, profiling tidak adil, hingga pelecehan dan penguntitan (stalking).
Jika kita tahu cara mendengarkannya, suara seseorang bisa memberi petunjuk tentang tingkat pendidikan, kondisi emosional, bahkan profesi dan kondisi finansialnya. Manusia biasanya menangkap isyarat seperti gugup, lelah, atau bahagia. Namun komputer mampu melangkah jauh lebih dalam — dan jauh lebih cepat.
Sebuah studi yang dipublikasikan pada 19 November 2025 di jurnal Proceedings of the IEEE mengungkap bahwa pola intonasi dan pilihan kata seseorang dapat mengindikasikan pandangan politik pribadi hingga kondisi kesehatan tertentu.
Artinya, setiap kali kita berbicara — dalam panggilan layanan pelanggan, pesan suara, atau interaksi berbasis suara lainnya — kita mungkin sedang membagikan informasi sensitif tanpa sadar.
Tom Bäckström, profesor teknologi ucapan dan bahasa dari Aalto University sekaligus penulis utama studi tersebut, memperingatkan bahwa potensi penyalahgunaan teknologi ini sangat nyata.
Ia menjelaskan, jika perusahaan dapat memahami kondisi ekonomi atau kebutuhan kita hanya dari suara, maka terbuka peluang terjadinya praktik price gouging (menaikkan harga secara diskriminatif), seperti penetapan premi asuransi yang berbeda berdasarkan profil suara.
“Jika perusahaan asuransi besar menyadari bahwa mereka bisa meningkatkan keuntungan dengan menetapkan harga secara selektif berdasarkan informasi dari suara kita menggunakan AI, apa yang akan menghentikan mereka?” ujarnya.
Baca juga: Evolusi AI, Perlukah Payung Hukum?
Suara bukan hanya soal kata. Nada, ritme, dan cara kita bernapas saat berbicara juga membawa informasi.
Jennalyn Ponraj, pendiri Delaire dan futuris yang meneliti regulasi sistem saraf manusia di tengah perkembangan teknologi, mengatakan: “Sangat sedikit perhatian diberikan pada fisiologi mendengarkan. Dalam situasi krisis, orang tidak terutama memproses bahasa. Mereka merespons nada, irama, prosodi, dan napas, sering kali sebelum kognisi sempat bekerja.”
Dengan kata lain, bahkan sebelum kita memahami isi pembicaraan, otak sudah merespons sinyal emosional dalam suara. Teknologi AI kini belajar melakukan hal yang sama — tetapi dengan kapasitas analisis yang jauh lebih besar.
Bäckström menambahkan bahwa teknologi untuk mendeteksi kemarahan atau toksisitas dalam gim online dan pusat panggilan memang sering dibicarakan dan memiliki tujuan yang etis. Namun ia melihat potensi penggunaan yang lebih meragukan.
Misalnya, sistem layanan otomatis yang menyesuaikan gaya bicara dengan gaya pelanggan. Sekilas terdengar inovatif, tetapi kemampuan adaptasi ini berarti sistem menganalisis informasi pribadi pengguna secara mendalam.
“Saya melihat banyak alat pembelajaran mesin untuk analisis yang melanggar privasi sudah tersedia, dan penggunaannya untuk tujuan jahat bukanlah hal yang mustahil,” kata Bäckström.
“Jika seseorang sudah menyadarinya, mereka bisa memiliki keunggulan yang sangat besar.”
Baca juga: Makin Cerdas, AI Ungkap Keganjilan di Lukisan Karya Raphael