Google AI

Google AI Lebih Cepat Baca Gerak Bibir Ketimbang Manusia

Penulis:Muhammad Faisal Hadi Putra
Terbit:
Diperbarui:
ā±ļø2 menit membaca
Bagikan:

Telset.id, Jakarta – Para peneliti dari divisi Aritifical IntelligenceĀ (AI)Ā Google yakni DeepMind dan University of Oxford telah menggunakan AI untuk membuatĀ software yang bisa membaca gerak bibir. Para peneliti ini memberikan data uji padaĀ softwareĀ dengan menggunakan ribuan jam rekaman TV dari BBC untuk melatih algoritmaĀ neural network yang ada di dalamnya.

Hasilnya,Ā softwareĀ Google AI tersebut mampu mencetak akurasi hingga 46,8 persen. Meski terlihat tidak terlalu mengesankan, namun jika dibandingkan dengan seorang manusia yang merupakan seorang profesional pembaca bibir yang hanya mendapatkan akurasi 12,4 persen saja, itu adalah hal yang luar biasa.

[Baca juga:Ā Programmer Ini Buat Temannya ā€œHidup Kembaliā€ dengan AI]

Sebenarnya penelitian tersebut mengikuti penelitian serupa yang juga dilakukan oleh University of Oxford. Para peneliti di kelompok yang berbeda ini menggunakanĀ software pembaca bibir bernama LipNet yang bisa mencapai akurasi 93,4 persen, unggul jauh dari yang bisa dicapai oleh manusia yakni 52,3 persen saja.

https://youtu.be/jK8Uz7cFCN8

Tapi, LipNet menggunakan dataĀ uji yang berasal dari rekaman khusus yang dibuat oleh para relawan. Bedanya denganĀ software besutan peneliti DeepMind dan University of Oxford, rekaman yang diberikan sebagai data uji lebihĀ greget karena menggunakan percakapan alami tanpa naskah yang didapat dari acara politik di BBC.

[Baca juga:Ā 8 Asisten Pribadi Paling Perhatian untuk Android]

Software yang juga disebut sebagai ā€œWatch, Listen, Attend, and Spellā€ ini disuguhi lebih dari 5 ribu jam rekaman acara TV termasukĀ Newsnight,Ā Question Time, danĀ World Today. Di dalam rekaman video tersebut ada 118.000 kalimat yang berbeda dan 17.500 kata-kata yang unik. Tentu jumlah tersebut sangat jauh jika dibandingkan dengan data uji pada LipNet yang hanya ada 51 kata-kata unik saja.

[Baca juga:Ā Teknologi Neural Machine Translation Bikin Google Translate Lebih Akurat]

Banyak pihak yang Ā berharap padaĀ software ini untuk bisa diterapkan pada perangkat keamanan seperti CCTV, dan lainnya. Namun para peneliti menyatakan bahwa mereka perlu melakukan sebuah terobosan untukĀ software tersebut agar bisa diterapkan pada kamera CCTV yang notabene memiliki resolusi danĀ frame rate lebih rendah dari rekaman video biasanya. (FHP/HBS)