當前位置: 華文問答 > 科學

有什麽好的文字轉語音(TTS)的軟件推薦?

2020-06-28科學

轉語音」,二是「語音轉文字」

今天更一篇很多粉絲有問過的問題,就如標題一樣

今天教程主要講的內容一是「文字轉語音」,二是「語音轉文字」

▍1 文字轉語音

文字轉語音,國內基本上看訊飛,但百度憑借自身做AI的實力,在語言辨識這方面還是不錯的

● 1.1 訊飛開放平台(最推薦)

網址:https://www. xfyun.cn/services/onlin e_tts

  • 科大訊飛是最早開始做語音辨識服務的企業,也是國家唯一專門做語音產業的863計劃成果,目前在語音辨識領域市場占有率大概70%多
  • 訊飛做語音業務早,公司應該是1999年成立的,就開始做語音業務。很多手機中都再使用訊飛語音引擎
  • 百度語音業務屬於後起之秀,不過綜合來說和訊飛還有一些差距。
  • 使用方法如下:開啟網頁,往下翻,翻到 「產品體驗」

    訊飛擁有超級豐富的發音人資源!!!

    甚至各種小語種,各種方言都有

    選擇你想合成的文字,然後點選立即合成

    原本我們可以靠IDM等軟件直接下載合成後的語音的,但訊飛為了避免大家白嫖現在加大限制了

    但我們還可以透過內錄電腦音訊來解決,

    提供一款錄音工具,需要在設定中設定僅錄制從電腦播放的聲音:⚠️點選此處即可下載

    開啟軟件,設定一下僅錄制從電腦播放的聲音

    接著播放網頁合成的語音,就能夠用這款軟件錄制下來了

    缺點就是一次只能合成250字了

    ● 1.2 訊飛有聲(安卓 / IOS)

    官網下載:http://xfyousheng.com

    開啟軟件,點選 「開始朗讀」

    輸入你想轉為語音的文字後,點選右上角分享按鈕,選擇短訊,這樣你會得到一個網頁連結

    在電腦上開啟這個網頁

    這裏需要用到網頁嗅探的辦法來下載音訊,如果你還不會,請去看阿虛之前寫的教程:你一定要會的網頁資源嗅探,下載任意網頁的一切資源

    等待語音播放完,用Chrome瀏覽器的Chrono擴充套件來嗅探資源,在Chrono資源嗅探器中,我們可以看到辨識出了3段音訊。

    前兩段是正文語音,最後一段是被加入的語音廣告

    下載前兩段後,我們用一些音訊編輯軟件,把這兩段語音合並起來備註

    阿虛這裏推薦三款 自用珍藏版的單檔版 軟件: ????、Audacity、WavePad

    ⚠️點選此處即可下載以上3款軟件

    這裏阿虛用的是Audacity

    ● 1.3 訊飛快讀(網頁 / 微信小程式)

    網址:https://www. ffkuaidu.com/

    訊飛子公司推出的產品,所以用的其實還是迅飛的技術,使用網頁版需要使用 微信登入

    免費使用者限制單次800字

    雖然非會員本來是不能下載mp3的!

    但是只要你學會了網頁資源嗅探,就能不開會員直接下載了

    如果你還不會,請去看阿虛之前寫的教程:你一定要會的網頁資源嗅探,下載任意網頁的一切資源

    最後就是,此網頁下載的音訊會在文末添加一段語音廣告,所以還是需要你自己手動用音訊編輯軟件刪除多余的廣告部份

    同時此網站提供微信小程式

    ● 1.4 訊飛配音(安卓 / IOS)

    官網:http:// peiyin.xunfei.cn/

    這款軟件大概不能叫文字轉語音了,就真的是花錢找人配音...

    按字數收費,而且這個價格說實話阿虛覺得挺高的,特殊場景可能才會用的上吧

    ▍2 語音轉文字

    語音轉文字要求的技術成本就要多的多了,所以這一般都是收費服務,而且還比較貴!

    但如果你對語音轉文字需求不大的話 (偶爾用一下) ,實際上還是有一些辦法白嫖的

    ● 2.1 訊飛聽見(網頁 / 安卓 / IOS)

    網頁:https://www. iflyrec.com/

    本來這是個收費的服務,分為以下2種

  • 中文/英文機器快轉:0.33元/分鐘;
  • 中文人工精轉:音質清晰、標準普通話、語速正常非專業領域的音訊價格為80元/小時,具體價格與音訊質素以及需求相關;人工精轉訂單起步價為18元,訂單金額不足18元按18元計費。
  • 但因為訊飛網頁端提供了中文/英文機器快轉的免費體驗,所以...其實就有辦法白嫖

    開啟官網後,點選上傳音訊,上傳音訊之後接著點選轉寫預覽

    稍等1分鐘就會辨識完畢, (這個音訊是用訊飛生成的音訊,然後我又把它上傳轉寫為文字) 可以看到當發音標準時,辨識率基本上達到100%

    但這個時候就有個問題了: 上面這個頁面的文字,是不能復制的!

    但相信關註阿虛的老粉絲都能輕松解決這個問題。

    這個時候我們就需要用到圖片文字辨識軟件了,阿虛之前寫過:從手機到電腦,究竟哪款OCR圖片文字辨識軟件最好用?沒看過的話,建議去看看並下載一個軟件

    下面阿虛使用的是天若OCR這個小軟件來獲取文字

    音訊剪輯軟件

    訊飛語音 只提供音訊前3分鐘的免費轉寫 預覽,所以如果你的音訊比較長的話,你需要用音訊編輯軟件手動切割一下音訊

    阿虛這裏推薦三款 自用珍藏版的單檔版 軟件: ????、Audacity、WavePad

    具體使用軟件怎麽切割的話,請自行摸索一下,或者百度一下,阿虛這裏就不多說明了

    1. Audacity2.3.0單檔版
    2. WavePad8.2.5註冊中文化單檔版
    3. ???6.18中文化單檔版

    ● 2.2 訊飛語記(安卓 / IOS / Windows)

    官網:http://www. iyuji.cn/iyuji/home

  • 這實際上算一款筆記軟件,提供即時錄音轉寫,所以 你可以用任意其他器材播放音訊,然後用訊飛語記來聽寫...
  • 當然,你也可以用訊飛輸入法來聽寫
  • 訊飛語記也提供外部錄音轉寫(同樣是收費0.33元/分鐘)
  • ● 2.3 百度語音介面

    網址:https:// cloud.baidu.com/product /speech

    百度AI開放平台,提供了免費的語音辨識服務,但是 沒有提供線上試用

    想要使用的話,需要你具有一定的開發能力,開發軟件來使用介面。

    但好在已經有大大開發了圖形化界面的軟件,我們只需要去簡單的申請一個套用,就能免費使用介面了

    ❶ 獲取百度語音介面

    開啟網址:https:// cloud.baidu.com/product /speech ,點選「立即使用」,並登入你的百度賬號

    點選建立套用

    只需 隨便填寫 套用名稱和套用描述,然後直接點選立即建立就行了

    建立好之後,點選「返回套用列表」

    然後就能獲取到我們需要的 API Key Secret Key

    ❷ 萬能君的小工具

    作者:https://www. 52pojie.cn/thread-98108 0-1-1.html

    ⚠️點選此處即可下載

    下載後解壓解壓解壓!然後雙擊main.exe執行即可,註意執行彈出的黑窗不能關(可以最小化)

    開啟軟件後點選左上角參數配置

    填寫我們剛剛獲取的Key

    註意:個人使用者有免費次數限制,不過百度免費次數個人用,肯定夠用了 同理,你可以在本軟件中填寫其他百度免費提供的其他API介面
  • 語音轉文字:http:// ai.baidu.com/tech/speec h/asrpro
  • 截圖文字辨識:http:// ai.baidu.com/tech/ocr/g eneral
  • 文字轉語音:http:// ai.baidu.com/tech/speec h/tts
  • 復制轉譯:http:// fanyi-api.baidu.com/api /trans/product/index
  • ● 2.4 i笛雲聽寫(網頁/安卓)

    官網:http://www. voiceclub.cn/index.html

    免費的語音轉文字服務

    如果你覺得我寫的文章不錯,歡迎來找我啊(看下圖!!!)