2022/09/23更新
最近有小夥伴私信我文字轉語音的程式碼看不懂,那麽我就再分享一個不用程式碼,就能將文字轉換為語音的工具給大家。
萬能文字辨識
分享這個軟體是因為它的工具箱很豐富,就像一個萬能的線上工具網站,但處理起來會比線上端穩定。
工作上經常需要用到的功能這裏都能找到,文字辨識、語音轉換、PDF轉換、轉譯工具、壓縮工具等等,雖然功能多但效果卻不含糊。
就比如這個文字換語音功能,它的配音型別就有上百種,使用場景也幫我們分類好了,廣告叫賣、有聲讀物、線上直播、新聞播報等等...
除了聲音多樣外,它還提供了多音字、插入間隔、數位讀法等多種特色功能,而且還能設定主播的語速、語調,讓聲音聽起來更接近真人發聲。
操作起來也是很簡單,選擇【文字轉語音】功能,將文字貼上到文本區域,點選【主播型別】選擇聲音型別,然後對背景音樂、主播語速、語調、多音字等進行設定。
最後點選【開始轉換】就會自動匯出一段音訊檔,轉換後的聲音效果非常自然好聽,沒有任何機械化的感覺,很是不錯。
都是copy的百度SDK文件,簡單說說怎麽用。
1、 沒安裝Python的參見此文:Python學習筆記系列 1 ——安裝偵錯Python開發軟體
2、 win+r輸入cmd開啟命令列,輸入:pip install baidu-aip,如下安裝百度AI的模組。
3、 新建文本文件,copy如下程式碼,然後另存為py字尾的文件即可, 小編的命名為:test.py 。
from aip import AipSpeech
""" 你的 APPID AK SK """
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
result = client.synthesis('你好百度', 'zh', 1, {
'vol': 5,'per':4
})
# 辨識正確返回語音二進制 錯誤則返回dict 參照下面錯誤碼
if not isinstance(result, dict):
with open('auido.mp3', 'wb') as f:
f.write(result)
4、 看文中程式碼
""" 你的 APPID AK SK """
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'
這幾個ID\key怎麽搞?很簡單,免費。
點選如下網站,百度開發者帳號隨便註冊,放心,免費。
然後,如下點選立即使用即可。
然後,如下點選建立套用即可,隨便填。
然後返回套用詳情,就看到了程式碼需要的三個ID
然後復制替換到程式碼中去。
5、 程式碼執行,依然是cmd,如下 輸入Python +test.py的路徑 即可生成auido.mp3檔,比如小編輸入
然後就搞定了。auido.mp3在哪裏呢,自己找哈。
註意:
程式碼中的
result = client.synthesis('你好百度', 'zh', 1, {
'vol': 5,'per':4
})
(1)你好百度 就是你需要的文字轉語音提供的文字,隨便替換。
(2)'per':4中的數位,如下代表: