Scroll untuk baca berita terbaru
banner 325x300

Microsoft Konfirmasi ChatGPT-4 Siap Dirilis yang Mengubah Teks Menjadi Video

3
×

Microsoft Konfirmasi ChatGPT-4 Siap Dirilis yang Mengubah Teks Menjadi Video

Sebarkan artikel ini

TEROBOSAN terbaru dilakukan Microsoft. Ya, ChatGPT merupakan chatbot revolusioner yang ditenagai oleh kecerdasan buatan (AI), akan segera dapat melakukan lebih dari sekadar mengirim pesan teks seperti manusia.

Seorang eksekutif Microsoft telah mengungkapkan bahwa versi berikutnya – yang akan dirilis minggu ini – akan dapat mengubah petunjuk teks menjadi video unik.

Raksasa teknologi itu telah banyak berinvestasi di ChatGPT dan telah meluncurkan sejumlah produk baru yang menggabungkannya sebagai asisten AI, seperti mesin pencari Bing.

Tetapi versi yang diperbarui ini, dijuluki GPT-4 dan diperkirakan akan diluncurkan pada hari Kamis pekan ini, akan memiliki ‘model multimodal’, menurut CTO Microsoft Jerman Andreas Braun.

Artinya, ini akan dapat menghasilkan konten dalam berbagai format, seperti klip audio, gambar dan klip video, dari perintah teks.

ChatGPT adalah model bahasa besar yang telah dilatih pada data teks dalam jumlah besar, yang memungkinkannya menghasilkan respons teks seperti manusia terhadap perintah yang diberikan.

Versi saat ini, dirilis oleh start-up OpenAI pada bulan November, dikenal sebagai GPT3.5, dan ternyata memiliki banyak kemampuan.

Misalnya, telah digunakan untuk lulus ujian, menyampaikan khotbah, menulis perangkat lunak dan memberikan saran hubungan.

Itu terbatas pada memberikan tanggapan sebagai teks, tetapi Mr Braun mengungkapkan bahwa itu akan berubah pada acara ‘AI in Focus – Digital Kickoff’.

Menurut Heise perkenalan akan GPT-4 dilaksanakan minggu depan. “Di sana kami akan memiliki model multimoda yang akan menawarkan kemungkinan yang sama sekali berbeda – misalnya video,” katanya seperti dilansir di dailymail.com, Selasa (14/3/2023).

Ini bukanlah konsep yang benar-benar inovatif – pada bulan September, raksasa teknologi pesaing Meta meluncurkan sistem AI-nya sendiri yang menghasilkan video dari perintah teks .

‘Make-A-Video’ dilatih tentang gambar dengan teks untuk membantunya mempelajari tentang dunia dan bagaimana dunia dideskripsikan dan video tanpa label untuk menentukan bagaimana dunia bergerak.

Namun, klip yang dihasilkan, meski mengesankan, cenderung buram dan kurang suara.

Make-A-Video belum tersedia untuk umum, tetapi rilis GPT-4.0 berpotensi mengubahnya.

Para ahli mengatakan bahwa kesuksesan kolaborasi ChatGPT dan OpenAI dengan Microsoft ‘menggegas’ Google untuk merilis chatbot AI-nya sendiri, Bard.

Spekulasi dimulai ketika Bard salah menjawab pertanyaan dalam video promosi – menghapus £100 miliar dari nilai perusahaannya.

Meskipun GPT-4 akan menjadi peluncuran pertama OpenAI ke dalam pembuatan video, GPT-4 telah mengembangkan AI teks-ke-gambar, DALL-E .

Pada tahun 2020, perusahaan juga mengumumkan Jukebox, alat yang membuat musik dari prompt dan dapat meniru gaya artis yang berbeda.

Meskipun tidak menyebutkan alat-alat ini secara spesifik, Mr Braun mengatakan bahwa ChatGPT baru akan membuat model menjadi komprehensif.

Pada acara ‘AI in Focus’, yang disiarkan ke mitra Microsoft dan pelanggan potensial, Braun tidak mengungkapkan apakah GPT-4 akan dirilis sendiri atau sebagai bagian dari produk.

Perusahaan teknologi memang memiliki acara yang direncanakan pada Kamis yang akan menampilkan ‘masa depan AI’, yang dapat memberikan lebih banyak informasi.

Rumor tentang seperti apa pembaruan ini akan terlihat sejak 2021, dengan Wired berspekulasi bahwa itu akan menggunakan 100 triliun parameter.

Ini akan memberikan lebih banyak opsi ‘kata berikutnya’ atau ‘kalimat berikutnya’ dalam konteks tertentu daripada saat ini, menjadikannya lebih mirip manusia.

Namun ini telah ditutup oleh CEO OpenAI Sam Altman, yang mengatakan kepada  StrictlyVC bahwa itu adalah ‘total bulls**t’.

Yang lain mengatakan GPT-4 akan lebih baik dalam menghasilkan kode komputer, menangani permintaan teks lebih lama dan dapat menampilkan teks, gambar, suara dan video.

Mr Altman memberi tahu podcast ‘AI untuk Era Selanjutnya’. “Saya pikir kita akan mendapatkan model multimodal tidak lama lagi, dan itu akan membuka hal-hal baru.”

Meskipun AI multi-modal yang komprehensif adalah konsep baru, diskusi tentang dampak pembuatan video AI telah berlangsung selama bertahun-tahun, khususnya terkait ‘deepfakes’.

Ini adalah bentuk AI yang menggunakan ‘pembelajaran mendalam’ untuk memanipulasi audio, gambar, atau video, membuat konten media yang hiper-realistis, tetapi palsu.

Istilah ini diciptakan pada tahun 2017 ketika pengguna Reddit memposting video porno yang dimanipulasi ke forum.

Video tersebut menukar wajah selebritas seperti Gal Gadot, Taylor Swift dan Scarlett Johansson, menjadi bintang porno.

Contoh terkenal lain dari deepfake atau ‘cheapfake’ adalah peniruan kasar Volodymyr Zelensky yang tampak menyerah kepada Rusia dalam sebuah video yang beredar luas di media sosial Rusia tahun lalu.

Klip itu menunjukkan presiden Ukraina berbicara dari mimbar ketika dia meminta pasukannya untuk meletakkan senjata mereka dan menyetujui pasukan penyerang Putin.

Pengguna internet yang cerdas segera menandai ketidaksesuaian antara warna leher dan wajah Zelensky, aksen aneh, dan pikselasi di sekitar kepalanya.

Terlepas dari nilai hiburan dari deepfake, beberapa ahli telah memperingatkan tentang bahaya yang mungkin mereka timbulkan.

Dr Tim Stevens, direktur Cyber ​​Security Research Group di King’s College London, mengatakan AI deepfake berpotensi merusak institusi demokrasi dan keamanan nasional.

Dia mengatakan ketersediaan alat ini secara luas dapat dimanfaatkan oleh negara-negara seperti Rusia untuk ‘menjebak’ populasi sasaran dalam upaya mencapai tujuan kebijakan luar negeri dan ‘merusak’ keamanan nasional negara.

Dia menambahkan ada potensi untuk AI dan deepfake untuk mempengaruhi keamanan nasional.

“Bukan pada tingkat pertahanan yang tinggi dan peperangan antarnegara tetapi pada umumnya yang merusak kepercayaan pada institusi demokrasi dan media. Mereka dapat dieksploitasi oleh otokrasi seperti Rusia untuk menurunkan tingkat kepercayaan pada institusi dan organisasi tersebut.”

Memang, diprediksi bahwa 90 persen konten online akan dihasilkan atau dibuat menggunakan kecerdasan buatan pada tahun 2025. (red)