Telset.id, Jakarta – Apple, bersama dengan perusahaan besar lainnya seperti Nvidia dan Anthropic, dilaporkan telah pakai konten dari YouTube untuk melatih model kecerdasan buatan (AI) mereka, termasuk Apple Intelligence.
Hal ini menjadi kontroversi karena melanggar kebijakan konten YouTube yang ketat. Sebenarnya ini mungkin tidak terlalu mengejutkan bagi beberapa orang, mengingat beberapa waktu beberapa perusahaan besar, seperti OpenAI pun melatih AI memakai video dari YouTube.
Investigasi yang dilakukan Proof News, yang dipublikasikan bersama Wired, mengungkap bahwa Apple menggunakan puluhan ribu video YouTube dengan subtitle untuk melatih model AI mereka.
BACA JUGA:
- Oh Tidak, Apple Intelligence Bakal Jadi Layanan Berbayar?
- Rangkaian Fitur Apple Intelligence Ditunda di Eropa, Kenapa?
Kumpulan data ini, dikenal sebagai YouTube Subtitles, dan ini pun mencakup transkrip dari 173.536 video YouTube yang berasal dari lebih dari 48.000 saluran berbeda-beda.
Video ini mencakup berbagai jenis konten, mulai dari saluran pendidikan seperti Khan Academy dan MIT (Massachusetts Institute of Technology) hingga situs berita seperti The Wall Street Journal, serta kreator terkemuka seperti MrBeast dan Marques Brownlee.
Marques Brownlee, salah satu kreator terkemuka di YouTube, menyatakan bahwa meskipun Apple tidak langsung mengambil data dari YouTube, mereka tetap menggunakan transkrip video yang diambil oleh perusahaan pihak ketiga, seperti yang dilaporkan oleh Gizmochina.
Hal ini pun tetap menjadi isu serius karena data tersebut berkontribusi pada pengembangan model AI, yang merupakan hasil investasi waktu dan uang dari para kreator. Brownlee menyimpulkan bahwa ini akan menjadi masalah yang terus berkembang dan memerlukan perhatian serius di masa mendatang.
Sementara itu, Proof News juga telah menciptakan sebuah alat yang memungkinkan para kreator mencari konten atau video mereka dalam kumpulan data tersebut yang dipakai Apple untuk melatih Apple Intelligence.
Meskipun kumpulan data Subtitel YouTube tidak menyertakan gambar dari video, namun mencakup beberapa subtitel terjemahan dalam berbagai bahasa. Kumpulan data ini dilaporkan dibuat oleh Eleuther AI, laboratorium penelitian nirlaba yang berfokus pada promosi norma sains terbuka.
Neal Mohan, Kepala Eksekutif YouTube, dalam sebuah wawancara, menegaskan bahwa penggunaan video YouTube untuk melatih model AI oleh perusahaan mana pun merupakan pelanggaran nyata terhadap kebijakan platform tersebut. Hal ini menunjukkan bahwa YouTube serius dalam menjaga integritas dan hak cipta konten yang dihasilkan oleh penggunanya.
Kontroversi ini menyoroti tantangan yang dihadapi industri teknologi dalam menggunakan data yang tersedia secara publik untuk pelatihan AI. Sementara penggunaan data publik dapat mempercepat inovasi dan pengembangan teknologi, hal ini juga harus dilakukan dengan mempertimbangkan hak dan kontribusi para kreator konten.
BACA JUGA:
- Bocoran Baru Ungkap Apple Intelligence Segera Hadir di Vision Pro
- Ini Dia Respon Google Atas OpenAI yang Pakai Video YouTube Tanpa Izin
Dengan meningkatnya perhatian terhadap masalah ini, perusahaan teknologi mungkin perlu mencari solusi yang lebih etis dan transparan dalam menggunakan data untuk melatih model AI mereka.
Selain itu, kebijakan dan regulasi yang lebih ketat mungkin diperlukan untuk memastikan bahwa penggunaan data publik tidak melanggar hak cipta dan privasi pengguna.