0

ChatGPT Sudah Mendengarkan dan Berbicara. Nantinya Mungkin Dapat Melihat

  • November 20, 2024

GTA777 – Mode Advanced Voice ChatGPT, yang memungkinkan pengguna bercakap-cakap dengan chatbot secara real-time, tampaknya akan segera mendapatkan kemampuan visual. Berdasarkan kode yang ditemukan di versi beta terbaru platform ini (v1.2024.317), fitur yang disebut sebagai “live camera” diprediksi akan segera dirilis, meskipun OpenAI belum memberikan konfirmasi resmi terkait waktu peluncurannya.

Apa Itu Advanced Voice Mode dengan Kamera?

ChatGPT meets a dog

Pada Mei lalu, OpenAI pertama kali mendemonstrasikan kemampuan penglihatan Advanced Voice Mode dalam versi alpha. Dalam demo tersebut, fitur ini mampu:

  • Mengidentifikasi objek melalui kamera ponsel, seperti anjing dalam video yang ditunjukkan.
  • Menghubungkan konteks, seperti mengenali bola milik anjing tersebut dan mengasosiasikan hubungan mereka (misalnya, bermain fetch).
  • Berinteraksi dengan objek secara dinamis, berdasarkan data visual dan percakapan sebelumnya.

Fitur ini langsung menjadi favorit di kalangan penguji alpha. Salah satu pengguna X (sebelumnya Twitter), Manuel Sainsily, bahkan menggunakan fitur ini untuk menjawab pertanyaan verbal tentang anak kucingnya menggunakan video dari kamera ponselnya.

Kapan Fitur Ini Tersedia?

Hingga kini, Advanced Voice Mode telah dirilis dalam versi beta untuk pelanggan Plus dan Enterprise sejak September. Namun, versi beta ini belum memiliki kemampuan visual seperti yang ditunjukkan dalam versi alpha. Informasi terbaru menunjukkan bahwa fitur kamera “live camera” mungkin akan segera hadir, memberikan pengalaman lebih interaktif dan imersif.

Keunggulan Fitur Baru

Jika fitur kamera ini resmi dirilis, Advanced Voice Mode OpenAI akan memiliki keunggulan yang signifikan dibandingkan pesaingnya, seperti:

  1. Gemini Live milik Google, yang dapat berbicara dalam lebih dari 40 bahasa tetapi belum memiliki kemampuan visual. Fitur kamera untuk Gemini diperkirakan baru hadir setelah peluncuran Project Astra.
  2. Natural Voice Interactions Meta, yang diluncurkan di acara Connect 2024, juga belum menggunakan input dari kamera.

Fitur visual ini memungkinkan ChatGPT tidak hanya memahami ucapan pengguna, tetapi juga “melihat” dunia di sekitarnya, memberikan pengalaman yang jauh lebih mendalam.

Advanced Voice Mode Kini Hadir di Desktop

Selain rumor fitur kamera, OpenAI juga mengumumkan bahwa Advanced Voice Mode kini tersedia untuk pengguna ChatGPT Plus di desktop. Sebelumnya, fitur ini eksklusif untuk perangkat mobile, tetapi sekarang bisa diakses melalui laptop atau PC, memberikan fleksibilitas lebih bagi pengguna.

Baca: Razer Blade 18: Laptop Gaming Tertipis yang Menggebrak Pasar Premium

Kesimpulan

Jika fitur live camera ini benar-benar dirilis, ChatGPT akan mengukuhkan posisinya sebagai pemimpin teknologi AI yang mampu berinteraksi secara multi-modal, menggabungkan suara, teks, dan visual dalam satu platform. Pengguna tidak hanya dapat bercakap-cakap secara real-time, tetapi juga melibatkan chatbot untuk memahami konteks visual di sekitar mereka. Bagi para penggemar teknologi, ini adalah langkah maju yang patut ditunggu.