Berikut adalah ikhtisar dari Konferensi Tingkat TInggi Machine Translation 2019 yang disusun oleh Gráinne Maycock, VP Sales Amplexor di Dublin. Ikhtisar ini membantu kita untuk melihat sekilas masa depan teknologi konten dan penerjemahan otomatis/penerjemahan mesin.
KTT MT telah berakhir, dan tidak mungkin meninggalkan konferensi selama tiga hari ini tanpa timbul semangat tentang apa yang akan datang. Atas kemajuan dalam neural machine translation/penerjemahan mesin berbasis saraf (NMT), klasifikasi kesalahan secara otomatis dan kualitas prediksi, hingga penelitian non-stop tentang intelijensi konten, kami melihat sekilas masa depan otomatisasi penerjemahan.
1. Estimasi kualitas prediksi: Dari teori ke praktik
Metodologi penilaian evaluasi bilingual (BLEU) terus dirujuk sebagai pilihan yang cepat dan murah untuk mengevaluasi kemajuan MT. Dikembangkan oleh insinyur MT, dan tidak memerlukan keterlibatan penerjemah, tetapi hasilnya menunjukkan hanya ada satu terjemahan yang benar untuk teks yang diberikan, yang mana hal ini jelas tidak tepat. Terjemahan “disetujui” kemudian ditetapkan sebagai referensi, baik dalam bahasa sumber dan bahasa target, dan skor evaluasi setinggi kemiripan antara output dan terjemahan referensi.
Jadi, sementara BLEU biasanya berkorelasi dengan penilaian manusia, ia tidak menjawab pertanyaan sebenarnya: seberapa baguskah konten terjemahan mesin yang sebenarnya?
Diskusi tentang metrik kualitas MT masih berlangsung, tetapi tujuannya adalah untuk mencapai posisi di mana setiap konten yang diterjemahkan mesin dilengkapi dengan estimasi kualitas yang melengkapi keterangan hasil MT, sehingga memberinya skor kualitas. Sepanjang setiap sesi, semua kontributor akhirnya mengakui dengan cekikikan gugup bahwa kualitas hanya dapat “benar-benar” dinilai oleh ulasan manusia (untuk saat ini).
2. Neural MT: Melakukan APE atau tidak
Jika saya harus memilih satu kata kunci untuk KTT MT, tentulah kata automatic post editing/pengeditan postingan otomatis (APE) untuk MT berbasis saraf – memang bukan hal yang baru ia mendapatkan daya tarik. Ketika mulai diuji oleh perusahaan e-commerce besar, APE berkembang menjadi kemungkinan bisnis yang nyata. Tetapi masih ada pertanyaan berseliweran: apakah ia kontra-produktif atau justru menghemat waktu?
APE telah mengikuti evolusi yang mirip dengan penerjemahan mesin. Tujuan dari sistem APE adalah untuk memperbaiki kesalahan dalam output MT dan menghasilkan post-edited machine translation/penerjemahan mesin pasca edit yang mirip pekerjaan penejemah manusia (PEMT). APE dapat meningkatkan konten yang diterjemahkan mesin atau menyesuaikannya dengan domain tertentu. Misalnya, dalam sistem yang berpemilik, dapat berguna sebagai cara untuk belajar dari koreksi manusia dan menghindari kesalahan berulang, mengajarkan pada sistem apa yang tidak boleh dilakukan. Bahkan dengan mesin MT berkualitas tinggi, pengeditan postingan otomatis dapat membantu mengurangi upaya manusia dalam pengeditan postingan.
APE juga dapat dimasukkan ke dalam alat computer-assisted translation/penerjemahan berbantuan komputer (CAT Tools) untuk membantu mengulas konten dalam pengeditan pasca. Namun, hasil uji aplikasi ini telah membuktikannya kontra-produktif, karena ahli bahasa cenderung menghabiskan lebih sedikit upaya pada segmen yang telah dinilai 90 persen (atau lebih) oleh alat APE, dan beralih ke segmen berikutnya. Masalahnya adalah bahwa skor 90 persen bisa jadi akurat bisa jadi tidak. Upaya yang dilakukan oleh ahli bahasa berkurang, tetapi kualitas pengiriman akhir mungkin harus dikompromikan. Singkatnya, meskipun kemajuan terus berlanjut di bidang ukuran kualitas prediktif dan aktual, masih banyak yang harus dicapai. Namun demikian, pengembangan terus berlanjut.
3. Terjemahan crowdsourcing: Bergerak antara harapan dan kenyataan
Terjemahan kerumunan/crowds translation pertama kali muncul sebagai solusi untuk startup atau organisasi nirlaba yang membutuhkan konten multibahasa, tetapi memiliki anggaran lokalisasi yang terbatas. Saat ini, crowdsourcing umumnya digunakan dalam konteks terjemahan mesin pengeditan pasca. Hal ini secara substansial dapat meningkatkan kualitas konten yang diterjemahkan mesin, tetapi juga dapat menjadi tantangan dalam hal pemantauan kualitas.
Dengan mengundang “kerumunan”, yang bisa berupa sekelompok kecil kolega atau klien, atau bahkan seluruh komunitas online, rangkaian teks dapat diterjemahkan dan kontrol kualitas dilakukan secara peer-to-peer – siapa pun dapat memberikan komentar atau koreksi.
Risikonya adalah bahwa ini semua tergantung pada minat dan kemauan untuk berkolaborasi dari anggota kerumunan, serta tidak tahu apakah mereka memenuhi syarat atau tidak. Putusannya adalah bahwa meskipun berada di jalur yang baik, masih ada kurva pembelajaran yang panjang untuk diatasi.
Pertanyaan yang tersisa: Ke mana teknologi membawa kita?
Teknologi konten terus berkembang dengan “kecepatan cahaya” dan terjemahan mesin tidak terkecuali.
Dalam dunia bisnis saat ini, komunikasi global terjadi secara real time. Untuk mengimbangi kecepatan ini, otomatisasi tidak dapat dihindari. Perusahaan di seluruh dunia beralih ke penerjemahan mesin untuk mengikuti peningkatan volume konten yang konstan dan “desa global” yang terus meningkat.
Seperti halnya desain baru, evolusi teknologi ini menimbulkan pertanyaan dan dilema menarik. Ke mana teknologi konten membawa kita? Bisakah kita menyetujui metrik terstandar untuk mengukur kualitas dan kinerja penerjemahan mesin? Bisakah kita memastikan akses data yang sama untuk semua orang? Bagaimana kami mengelola integritas konten? Bisakah kualitas terjemahan mesin benar-benar dinilai tanpa ulasan manusia? Apakah solusi untuk pengenalan suara sejalan?
Sebagai mitra solusi konten global, kami senang menjadi bagian dari revolusi konten ini dan terus membantu pelanggan kami menemukan ramuan teknologi yang ideal dan tingkat kualitas untuk berkomunikasi secara efektif dengan audiens target di seluruh dunia.
Satu hal yang pasti: Harapan tinggi untuk melihat apa yang European Association for Machine Translation/Asosiasi Eropa untuk Terjemahan Mesin (EAMT) akan bawa ke KTT MT 2020!
Untuk melanjutkan percakapan serupa, bergabunglah dengan kami pada 30 September di TAUS, Dublin di mana kita akan bergabung dengan para pemimpin industri untuk mengeksplorasi tren terkini dalam terjemahan mesin, pengeditan pos, evaluasi kualitas dan evolusi teknologi, serta aplikasi mereka dalam skenario dunia nyata.
Salam Excellent!