CakapCakap – Teknologi kecerdasan buatan atau artificial intelligence (AI) jadi inovasi paling hebat di dunia saat ini. Cakap People pun pastinya sudah mengetahui, para ilmuwan di seluruh dunia terus berupaya mengembangkan dan menyempurnakan teknologi tersebut untuk bisa membantu semua kebutuhan manusia semaksimal mungkin. Kabar paling anyar, para ilmuwan Massachusetts Institute of Technology (MIT) baru saja berhasil mengembangkan teknologi AI ke tingkat yang lebih lanjut.
Seperti dilaporkan laman Suara.com, para ilmuwan MIT mengembangkan teknologi AI hingga bisa menebak wajah seseorang hanya melalui suaranya, di mana mesin itu diberi nama ‘Speech2Face. Hasil penelitian itu pun telah diterbitkan dalam jurnal ‘arXiv’. Teknologi AI ini pun mampu merekam jutaan video dari YouTube dan menyimpannya dalam bentuk data dalam server. Setelahnya, mesin ini apat mendeteksi dan mencocokkan gelombang suara, serta merekonstruksi wajah seseorang.
Namun, hasil penelitian ini juga dapat menimbulkan pertanyaan mengkhawatirkan tentang privasi dan keamanan. “Meski ini adalah penyelidikan murni akademis, kami merasa penting untuk secara eksplisit membahas dalam makalah ini serangkaian pertimbangan etis, karena potensi sensitivitas informasi wajah. Penelitian lebih lanjut atau penggunaan praktis teknologi ini akan diuji secara cermat sehingga mewakili populasi pengguna yang dituju,” jelas perwakilan ilmuwan MIT pula.
Diprediksi, teknologi AI tersebut nantinya juga akan dapat menebak atribut fisik seseorang seperti usia, jenis kelamin, dan etnis di masa depan. Teknologi AI bisa mencocokkan beberapa karakteristik biometrik pembicara dan merekonstruksi wajah berdasar data yang sudah tersimpan sebelumnya.
Tim peneliti yang dipimpin oleh mahasiswa postdoctoral Tae-Hyun Oh ini memang tidak bertujuan untuk menebak identitas sebenarnya dari pemilik suara tersebut, demi memastikan tidak adanya pelanggaran privasi. Tapi, mereka tetap berharap teknologi AI ini tetap memiliki kegunaan, seperti untuk memperlihatkan wajah yang representatif berdasarkan suara pembicara terutama untuk panggilan telepon. Mereka pun melatih mesin ini dengan menggunakan jutaan video dari YouTube dengan lebih dari 100 ribu pembicara yang berbeda. Dari database itu, diciptakan model berbasis jaringan neural yang telah mempelajari atribut vokal terkait dengan fitur wajah tertentu dari video.
Keren ya, Cakap People!