首先必須要聲明一下啊,作為一名語音技術的研究人員,顯然非常不能接受有童鞋說的十年之內語音技術只能用於輸入法的說法,這不是要砸我飯碗麽……好了好了,言歸正傳。
對於語音技術,可能大部份外人的理解還僅僅局限在語音辨識上。事實上,當我給別人說起自己專業的時候,都是用「語音辨識」(尷尬ing)。其實,語音技術還包括非常多實用的方向,比如說話人辨識、語種辨識、語音合成、音色轉換、語音增強等等。
語音技術能做什麽?想象一下,當你回到家說一句「芝麻開門,我是xxx」,門就為你開啟;你也可以對家裏的電器說話,而它們(他們?)只接受你這個主人的控制,是不是有種真的當家做主人的感覺?而借助於語種辨識,不管你說的是漢語還是英語乃至阿拉伯語,你的機器都能準確地完成你交付的任務;至於音色轉換……當你想念一個美女或者帥哥的時候,你可以……咳咳……