Sekilas pengolahan teks
Sebuah teks pidato sistem-(atau “mesin”) adalah terdiri dari dua bagian sebuah front-end dan back-end . Pertama, mengkonversi teks mentah mengandung simbol seperti angka dan singkatan menjadi setara dengan kata-kata tertulis-out. . Proses ini sering disebut teks normalisasi, pra-pengolahan, atau tokenization . The front-end kemudian memberikan transkripsi fonetik untuk setiap kata, dan membagi dan menandai teks ke unit prosodi , seperti frase , klausa , dan kalimat . Proses penempatan transkripsi fonetis kata-kata disebut teks-ke-fonem atau grafem ke-fonem konversi.transkripsi Fonetik dan informasi prosodi bersama-sama membentuk representasi linguistik simbolik yang output dengan front-end. The back-end-sering disebut sebagai synthesizer-makamengubah representasi bahasa simbolik menjadi suara. Dalam sistem tertentu, bagian ini meliputi perhitungan dari target prosodi (kontur pitch, durasi fonem , yang kemudian dikenakan pada pidato output.
peech synthesis atau Pidato sintesis adalah produksi buatan manusia pidato . Sebuah sistem komputer yang digunakan untuk tujuan ini disebut synthesizer pidato, dan dapat diimplementasikan dalam perangkat lunak atau perangkat keras . Sebuah teks-to-speech (TTS) sistem mengkonversi teks ke dalam pidato bahasa normal; sistem lain membuat representasi linguistik simbolik seperti transkripsi fonetik pidato.
Pidato disintesis dapat dibuat dengan menggabungkan potongan pidato direkam yang disimpan dalam database . Sistem berbeda dalam ukuran unit pidato disimpan, sebuah sistem yang menyimpan telepon atau diphones menyediakan berbagai keluaran terbesar, tapi mungkin kurang jelas. Untuk domain penggunaan khusus, penyimpanan seluruh kata-kata atau kalimat memungkinkan untuk output berkualitas tinggi. Atau, synthesizer dapat menggabungkan sebuah model dari saluran vokal dan karakteristik suara manusia untuk membuat yang benar-benar “sintetik” output suara.
Kualitas synthesizer pidato dinilai oleh kesamaannya dengan suara manusia dan dengan kemampuannya untuk dipahami. Sebuah program text-to-speech dipahami memungkinkan orang dengan gangguan penglihatan atau membaca cacat untuk mendengarkan karya tulis di komputer rumah. Banyak komputer operasi telah menyertakan synthesizer pidato sejak awal 1980-an.
Sumber: http://en.wikipedia.org/wiki/Speech_synthesis