DeepL, platform penerjemah yang cukup terkenal, baru saja meluncurkan fitur anyar. Mereka menyebutnya voice-to-voice. Intinya, kamu bisa bicara langsung dan dapat terjemahan suara secara real-time. Fitur ini dirancang untuk berbagai situasi, lho. Bayangkan rapat penting dengan klien internasional, atau sekadar ngobrol santai lewat ponsel. Bahkan, bisa sangat membantu para pekerja di garda depan yang setiap hari berinteraksi dengan orang dari berbagai negara.
Menurut sejumlah saksi yang melihat demo, teknologi ini terasa cukup responsif. CEO DeepL, Jarek Kutylowski, menjelaskan alasan di balik pengembangan fitur ini.
“Kami sudah bertahun-tahun berkutat dengan penerjemahan teks. Jadi, melangkah ke ranah suara adalah hal yang wajar bagi kami,” ujarnya.
Memang, sebelumnya DeepL cuma fokus pada teks dan dokumen. Mereka belum punya kemampuan untuk menangani percakapan langsung. Nah, tantangan terbesarnya ternyata soal timing. Kutylowski mengakui, mereka harus pintar-pintar menyeimbangkan antara kecepatan dan akurasi. Soalnya, latensi atau jeda waktu antara ucapan asli dan terjemahannya harus seminimal mungkin, tapi hasilnya tetap harus tepat.
Di sisi lain, DeepL juga merilis add-on khusus untuk platform rapat populer seperti Zoom dan Microsoft Teams. Dengan add-on ini, peserta rapat bisa mendengarkan terjemahan langsung sementara pembicara masih berbicara dengan bahasa aslinya. Atau, mereka juga bisa membaca teks terjemahan yang muncul di layar secara real-time.
Namun begitu, fitur voice-to-voice ini belum bisa dinikmati semua orang. Saat ini masih dalam fase akses awal. DeepL membuka pendaftaran antrean bagi konsumen yang penasaran dan ingin mencoba.
Yang menarik, teknologi mereka diklaim bisa belajar. Sistemnya bisa beradaptasi dengan kosakata khusus, misalnya istilah teknis di industri tertentu, atau bahkan nama perusahaan dan nama orang. Jadi, bukan sekadar terjemahan kaku.
Perusahaan mengontrol seluruh proses teknologi voice-to-voice ini. Meski begitu, sistem yang berjalan sekarang masih melalui beberapa tahap: suara diubah jadi teks, lalu diterjemahkan, kemudian diubah kembali menjadi suara. Rencana ke depannya? Mereka ingin mengembangkan model yang lebih mulus, yaitu terjemahan suara end-to-end tanpa perlu konversi ke teks terlebih dahulu. Itu tentu akan jadi lompatan besar.
Jadi, kita tunggu saja perkembangannya. Jika berhasil, cara kita berkomunikasi lintas bahasa mungkin akan berubah drastis.
Artikel Terkait
Persija Kejar Puncak, Souza Soroti Konsistensi sebagai Kunci Juara
Keluarga Kulon Progo Terdampar di Kolong Semanggi Usai Jadi Korban Copet
Kemlu Evakuasi 45 WNI dari Iran, 13 ABK Masih Menunggu di Baku
Pemerintah Pacu Biodiesel B50 dan E20 untuk Kurangi Ketergantungan Impor Energi