Bermain dengan Text-to-Speech


Kemarin sempat iseng menelusuri tentang text-to-speech. Permainan Tebak Pasal menggunakan suara yang mengucapkan bunyi dari pasal-pasal yang salah dijawab. Suara tersebut dihasilkan oleh situs kumandang.com yang bisa menghasilkan suara berformat mp3 dari masukan teks. Di belakang situs tersebut, digunakan program text-to-speech.

Text-to-speech adalah sistem yang mengkonversi teks bahasa normal menjadi bunyi. TTS bahasa Indonesia yang sempat kucoba kemarin adalah indotts dan espeak.

indotts diciptakan oleh A.A. Arman dari ITB. Kualitas suara yang dihasilkan IndoTTS ini mendekati suara manusia. Sayangnya aplikasinya akan crash apabila dimasukkan teks yang terlalu panjang. Kelebihan indotts adalah adanya fitur “Prosody” yang mengatur lagu, tempo, dan penjedaan dari suara yang dihasilkan agar mirip dengan suara manusia. Prosodi adalah kajian tentang persajakan, yaitu mengkaji tekanan, matra, rima, irama, dan bait dalam sajak (KBBI).

Alternatif lain dari indotts adalah espeak. Kalau espeak ini selain bahasa Indonesia juga ada bahasa lain juga. DI dalam espeak ini sudah ada prosody editor. Tapi prosodi di sini harus diatur sendiri, fonem demi fonem, tidak seperti indotts yang tinggal pakai. Dan ternyata mengatur prosodi itu sesuatu yang sama sekali tidak saya pahami. -.-

TTS bisa kita manfaatkan untuk membantu proses belajar bagi yang punya kecenderungan belajar auditori (dengan mendengar). Bahkan bisa membantu penyandang tunanetra (membuat semacam audiobook secara instan). Memang suaranya masih sangat robotik (untuk espeak, karena prosodinya tidak diatur), tapi setidaknya masih bisa dipahami.

Semoga TTS Bahasa Indonesia ke depannya makin berkembang dan makin mantap.

Komentar Pemirsa