TEMPO.CO, Jakarta - Google merilis AI generatif Veo 3 dan Imagen 4 untuk pembuatan video dalam aplikasi Flow. Model kecerdasan buatan terbaru ini diluncurkan dalam agenda konferensi tahunan pengembang Google I/O 2025, yang dimulai sejak Selasa, 20 Mei kemarin.
“Model-model ini menciptakan gambar, video, dan musik yang memukau, memberdayakan seniman untuk mewujudkan visi kreatif mereka,” kata Wakil Presiden Google DeepMind Eli Collins, dikutip dari blog Google pada Rabu, 21 Mei 2025.
Baca berita dengan sedikit iklan, klik di sini
Menurut Collins, Veo 3 merupakan video hasil kolaborasi gambar yang disertai tambahan audio pendukung. Suara latar belakangnya sesuai dengan lingkungan sekitar karakter yang dibuat, seperti suara lalu lintas di perkotaan, kicauan burung di taman, hingga dialog antar karakter.
Dia mengklaim Veo 3 unggul dalam sinkronisasi antara audio dengan bibir karakter saat bicara. Model ini menampilkan visual berdasarkan cerita yang diberikan oleh pengguna. Ada juga klip video yang menghidupkan cerita tersebut.
Veo 3 tersedia melalui aplikasi Gemini dan Flow untuk pelanggan Ultra di Amerika Serikat di aplikasi Gemini dan di Flow. Layanan ini juga tersedia bagi pengguna Vertex AI.
Veo 3 memiliki pembaruan yang tidak ada pada AI Veo 2, Veo 3. Model AI generatif terbaru ini memiliki video referensi yang lebih canggih, kontrol kamera untuk menentukan gerakan sudut pandang kamera, serta outpainting untuk menyesuaikan bingkai gambar. Ada juga penambahan dan penghapusan objek.
Pada Imagen 4, mobilitas gambar yang dihasilkan lebih cepat dibanding Imagen 3. Kualitas hasil Imagen 4 diklaim lebih detail dan halus, termasuk pada gambar serat kain, percikan air, dan bulu binatang.
Model ini, ujar Collins, lebih baik dalam hal ejaan dan tipografi, sehingga bisa dimanfaatkan juga untuk membuat kartu ucapan, poster, hingga komik sendiri. “Imagen 4 dapat menciptakan gambar dalam berbagai rasio aspek dan resolusi hingga 2K, bahkan lebih baik untuk pencetakan atau presentasi,” tuturnya.
AI Generatif untuk Komposisi Musik
Selain Veo 3 dan Imagen 4, Google juga meluncurkan Lyria 2 untuk memperluas akses ke musik AI Sandbox. Model ini menghadirkan komposisi dan eksplorasi tidak terbatas, sehingga membantu kreasi, kontrol, dan permainan musik generatif secara interaktif.
Google tetap memberikan watermark terhadap produk AI generatif yang dihasilkan model-model tersebut. Dalam pembuatan gambar atau video, ada tanda air yang diproduksi oleh aplikasi Google bernama SynthID.
Saat ini bahkan ada SynthID Detector yang menjadi portal verifikasi identifikasi konten AI. “Unggah sepotong konten dan SynthID Detector akan mengidentifikasi apakah seluruh atau sebagian file saja yang mengandung SynthID,” kata
Google memastikan pembuatan model AI melibatkan para seniman dan kreator konten YouTube. Selain memberi alat baru bagi kreator, model kecerdasan buatan juga memudahkan dan mempercepat munculnya ide.