Telset.id, Jakarta – OpenAI baru saja mengumumkan model AI terbarunya, Sora. Sora diklaim bisa menghasilkan video beresolusi tinggi dalam 1 menit hanya dari perintah teks.
Sekadar informasi, nama Sora sendiri diadopsi dari bahasa Jepang yang berarti langit. Namun, AI ini untuk sekarang tidak tersedia untuk umum, karena OpenAI hanya memberikan akses kepada peneliti dan ahli untuk memeriksa keamanannya.
OpenAI mengklaim bahwa model AI Sora mampu menghasilkan video dengan banyak adegan kompleks yang menampilkan karakter, jenis gerakan tertentu, dan detail subjek beserta latar belakang yang akurat.
BACA JUGA:
- OpenAI dan Upaya Membuat Chip AI Sendiri: Risiko dan Peluang
- OpenAI Berencana Luncurkan GPT Store Awal Tahun Depan
“Model AI terbaru ini bahkan memahami tidak hanya apa yang diminta oleh para pengguna berdasarkan perintah teks saja, tetapi juga bagaimana menyesuaikan hal-hal tersebut seperti yang ada di dunia nyata,” klaim OpenAI.
Salah satu video yang merupakan hasil buatan Sora yang dibagikan OpenAI di situsnya menunjukkan pasangan berjalan melalui kota Tokyo yang bersalju di saat bunga sakura dan kepingan salju berhembus di sekitar pasangan tersebut.
Ada juga contoj video lainnya yang menunjukkan mammoth berbulu yang tampak realistis berjalan melalui padang rumput bersalju dengan latar belakang pegunungan yang diselimuti salju.
OpenAI menjelaskan bahwa model ini berfungsi sebagai hasil dari pemahaman bahasa yang mendalam, yang memungkinkannya menafsirkan perintah teks secara akurat.
https://twitter.com/OpenAI/status/1758192957386342435?t=AcO7hJ_sL7QBPEF626G8dA&s=19
Namun, seperti semua generator gambar dan video AI yang pernah ada sebelumnya, Sora masih belum sempurna. Misalnya, dalam salah satu contoh, prompt, yang meminta video seekor Dalmatian melihat melalui jendela dan orang-orang berjalan dan bersepeda di sepanjang jalan sungai, menghilangkan orang dan jalan-jalan dalam video tersebut sepenuhnya.
OpenAI juga memperingatkan bahwa model tersebut mungkin kesulitan memahami sebab dan akibat. Contohnyaa, model tersebut dapat menghasilkan video seseorang yang sedang memakan kue, tetapi kue tersebut mungkin tidak memiliki bekas gigitan.
Sora memang bukanlah model AI dari perintah teks pertama yang ada. Karena, perusahaan lain seperti Meta, Google, dan Runway telah memperkenalkan alat serupa dan bahkan menyediakannya untuk umum.
Sayangnya, saat ini belum ada alat lain yang mampu menghasilkan video berdurasi 60 detik seperti milik OpenAI.
Selain itu, Sora juga menghasilkan seluruh video sekaligus. Alih-alih menyatukan gambar per gambar seperti model lainnya, sehingga memastikan bahwa subjek dalam video tetap sama meskipun tidak terlihat untuk sementara.
Maraknya alat teks-ke-video telah memicu kekhawatiran akan potensi alat tersebut untuk lebih mudah membuat rekaman palsu yang tampak realistis.
“Saya benar-benar takut hal semacam ini akan mempengaruhi pemilu yang diperebutkan secara ketat,” kata Oren Etzioni, seorang profesor di Universitas Washington dengan spesialisasi di bidang kecerdasan buatan, sekaligua pendiri True Media.
Sementara itu, OpenAI mengatakan bahwa pihaknya sudah bekerja sama dengan para ahli di berbagai bidang seperti misinformasi, konten kebencian, dan bias untuk menguji alat tersebut sebelum menyediakannya kepada publik.
BACA JUGA:
- Canggih! ChatGPT Bakal Ingat Percakapan dengan Pengguna
- Hati-hati! Menulis Kata Berulang di ChatGPT Dianggap Pelanggaran
Untuk mengatasi hal-hal yang tidak diinginkan, OpenAI juga membangun alat yang mampu mendeteksi video yang dihasilkan oleh Sora dan menyertakan metadata dalam video yang dihasilkan untuk memudahkan deteksi.
Namun, perusahaan yang dipimpin Sam Altman tersebut menolak memberi tahu Times bagaimana Sora dilatih. Perusahaan menyatakan bahwa mereka menggunakan video yang tersedia untuk umum serta video yang dilisensikan dari pemegang hak cipta. [FY/IF]