当前位置: 华文问答 > 科学

有什么好的文字转语音(TTS)的软件推荐?

2020-06-28科学

转语音」,二是「语音转文字」

今天更一篇很多粉丝有问过的问题,就如标题一样

今天教程主要讲的内容一是「文字转语音」,二是「语音转文字」

▍1 文字转语音

文字转语音,国内基本上看讯飞,但百度凭借自身做AI的实力,在语言识别这方面还是不错的

● 1.1 讯飞开放平台(最推荐)

网址:https://www. xfyun.cn/services/onlin e_tts

  • 科大讯飞是最早开始做语音识别服务的企业,也是国家唯一专门做语音产业的863计划成果,目前在语音识别领域市场占有率大概70%多
  • 讯飞做语音业务早,公司应该是1999年成立的,就开始做语音业务。很多手机中都再使用讯飞语音引擎
  • 百度语音业务属于后起之秀,不过综合来说和讯飞还有一些差距。
  • 使用方法如下:打开网页,往下翻,翻到 「产品体验」

    讯飞拥有超级丰富的发音人资源!!!

    甚至各种小语种,各种方言都有

    选择你想合成的文字,然后点击立即合成

    原本我们可以靠IDM等软件直接下载合成后的语音的,但讯飞为了避免大家白嫖现在加大限制了

    但我们还可以通过内录电脑音频来解决,

    提供一款录音工具,需要在设置中设置仅录制从电脑播放的声音:⚠️点击此处即可下载

    打开软件,设置一下仅录制从电脑播放的声音

    接着播放网页合成的语音,就能够用这款软件录制下来了

    缺点就是一次只能合成250字了

    ● 1.2 讯飞有声(安卓 / IOS)

    官网下载:http://xfyousheng.com

    打开软件,点击 「开始朗读」

    输入你想转为语音的文字后,点击右上角分享按钮,选择短信,这样你会得到一个网页链接

    在电脑上打开这个网页

    这里需要用到网页嗅探的办法来下载音频,如果你还不会,请去看阿虚之前写的教程:你一定要会的网页资源嗅探,下载任意网页的一切资源

    等待语音播放完,用Chrome浏览器的Chrono扩展来嗅探资源,在Chrono资源嗅探器中,我们可以看到识别出了3段音频。

    前两段是正文语音,最后一段是被加入的语音广告

    下载前两段后,我们用一些音频编辑软件,把这两段语音合并起来备注

    阿虚这里推荐三款 自用珍藏版的单文件版 软件: ????、Audacity、WavePad

    ⚠️点击此处即可下载以上3款软件

    这里阿虚用的是Audacity

    ● 1.3 讯飞快读(网页 / 微信小程序)

    网址:https://www. ffkuaidu.com/

    讯飞子公司推出的产品,所以用的其实还是迅飞的技术,使用网页版需要使用 微信登录

    免费用户限制单次800字

    虽然非会员本来是不能下载mp3的!

    但是只要你学会了网页资源嗅探,就能不开会员直接下载了

    如果你还不会,请去看阿虚之前写的教程:你一定要会的网页资源嗅探,下载任意网页的一切资源

    最后就是,此网页下载的音频会在文末添加一段语音广告,所以还是需要你自己手动用音频编辑软件删除多余的广告部分

    同时此网站提供微信小程序

    ● 1.4 讯飞配音(安卓 / IOS)

    官网:http:// peiyin.xunfei.cn/

    这款软件大概不能叫文字转语音了,就真的是花钱找人配音...

    按字数收费,而且这个价格说实话阿虚觉得挺高的,特殊场景可能才会用的上吧

    ▍2 语音转文字

    语音转文字要求的技术成本就要多的多了,所以这一般都是收费服务,而且还比较贵!

    但如果你对语音转文字需求不大的话 (偶尔用一下) ,实际上还是有一些办法白嫖的

    ● 2.1 讯飞听见(网页 / 安卓 / IOS)

    网页:https://www. iflyrec.com/

    本来这是个收费的服务,分为以下2种

  • 中文/英文机器快转:0.33元/分钟;
  • 中文人工精转:音质清晰、标准普通话、语速正常非专业领域的音频价格为80元/小时,具体价格与音频质量以及需求相关;人工精转订单起步价为18元,订单金额不足18元按18元计费。
  • 但因为讯飞网页端提供了中文/英文机器快转的免费体验,所以...其实就有办法白嫖

    打开官网后,点击上传音频,上传音频之后接着点击转写预览

    稍等1分钟就会识别完毕, (这个音频是用讯飞生成的音频,然后我又把它上传转写为文字) 可以看到当发音标准时,识别率基本上达到100%

    但这个时候就有个问题了: 上面这个页面的文字,是不能复制的!

    但相信关注阿虚的老粉丝都能轻松解决这个问题。

    这个时候我们就需要用到图片文字识别软件了,阿虚之前写过:从手机到电脑,究竟哪款OCR图片文字识别软件最好用?没看过的话,建议去看看并下载一个软件

    下面阿虚使用的是天若OCR这个小软件来获取文字

    音频剪辑软件

    讯飞语音 只提供音频前3分钟的免费转写 预览,所以如果你的音频比较长的话,你需要用音频编辑软件手动切割一下音频

    阿虚这里推荐三款 自用珍藏版的单文件版 软件: ????、Audacity、WavePad

    具体使用软件怎么切割的话,请自行摸索一下,或者百度一下,阿虚这里就不多说明了

    1. Audacity2.3.0单文件版
    2. WavePad8.2.5注册汉化单文件版
    3. ???6.18汉化单文件版

    ● 2.2 讯飞语记(安卓 / IOS / Windows)

    官网:http://www. iyuji.cn/iyuji/home

  • 这实际上算一款笔记软件,提供实时录音转写,所以 你可以用任意其他设备播放音频,然后用讯飞语记来听写...
  • 当然,你也可以用讯飞输入法来听写
  • 讯飞语记也提供外部录音转写(同样是收费0.33元/分钟)
  • ● 2.3 百度语音接口

    网址:https:// cloud.baidu.com/product /speech

    百度AI开放平台,提供了免费的语音识别服务,但是 没有提供在线试用

    想要使用的话,需要你具有一定的开发能力,开发软件来使用接口。

    但好在已经有大大开发了图形化界面的软件,我们只需要去简单的申请一个应用,就能免费使用接口了

    ❶ 获取百度语音接口

    打开网址:https:// cloud.baidu.com/product /speech ,点击「立即使用」,并登录你的百度账号

    点击创建应用

    只需 随便填写 应用名称和应用描述,然后直接点击立即创建就行了

    创建好之后,点击「返回应用列表」

    然后就能获取到我们需要的 API Key Secret Key

    ❷ 万能君的小工具

    作者:https://www. 52pojie.cn/thread-98108 0-1-1.html

    ⚠️点击此处即可下载

    下载后解压解压解压!然后双击main.exe运行即可,注意运行弹出的黑窗不能关(可以最小化)

    打开软件后点击左上角参数配置

    填写我们刚刚获取的Key

    注意:个人用户有免费次数限制,不过百度免费次数个人用,肯定够用了 同理,你可以在本软件中填写其他百度免费提供的其他API接口
  • 语音转文字:http:// ai.baidu.com/tech/speec h/asrpro
  • 截图文字识别:http:// ai.baidu.com/tech/ocr/g eneral
  • 文字转语音:http:// ai.baidu.com/tech/speec h/tts
  • 复制翻译:http:// fanyi-api.baidu.com/api /trans/product/index
  • ● 2.4 i笛云听写(网页/安卓)

    官网:http://www. voiceclub.cn/index.html

    免费的语音转文字服务

    如果你觉得我写的文章不错,欢迎来找我啊(看下图!!!)