您当前的位置：首页资讯行业知识正文

百度语音识别离线使用如何收费？

发布日期：2020-06-08 09:30:06 浏览次数：1083

百度语音识别离线使用如何收费？

现在人工智能发展越来越快，语音识别也是使用越来越频繁，那么语音识别，应用在哪里呢？手机应用语音输入、机器人对话、语音内容分析、实时语音转写等等，

语音识别都可以做什么？

1。短语音识别标准

60秒内准确识别语音为文本，集成百度领先的自然语言处理技术，支持手机语音输入、语音搜索、智能语音对话等场景

2。短语音识别的快速版本

60秒以内的语音文本快速识别适用于手机语音输入、语音搜索、人机对话等语音交互场景

3。实时语音识别

实时将音频流识别为文本，返回每个句子的开始和结束时间，适用于长句语音输入、音视频字幕、会议等场景

4。远场语音识别

通过麦克风阵列前端处理算法，即使在3-5米的距离上讲话，也能准确地识别出目标扬声器

5。音频文件转录

将批量上传的音频文件识别为文本，并在12小时内返回识别结果。适用于录音质检、会议内容总结、音频内容分析等场景

6。语音自训练平台

利用业务场景语料库，自助训练语言模型，准确识别语音内容，提高业务领域识别的准确性

在原有语音识别技术的基础上，百度新增加了语音识别功能，使语音识别不再局限于60秒，并免费为开发者提供。例如，开发人员可以在会议录制、实时字幕、语音备忘等场景中使用长语音识别，使产品能够将不同的长音频转换成文字信息，或者将直播、视频、直播语音等音频转换成实时字幕，方便后期处理和内容归档，节省了录制的人力和时间成本，大大提高了转换效率，给开发者和用户更好的使用体验。

据了解，作为全球最早进入人工智能领域的公司之一，百度早在2010年就开始了智能语音及相关技术的研发，并于2014年底和2015年底分别发布了deep speech和deep speech 2，即deep speech识别系统。该系统采用“端到端”的深度学习技术，在嘈杂环境下的性能优于谷歌、微软和苹果的语音系统。同时，百度凭借深度语音识别技术入选2016年麻省理工学院十大突破技术之一。2017年初，百度推出了网络应用swiftscribe，可以将音频文件转换成文本。在30秒内，它可以转换持续1分钟的音频文件。转换效率是人工速记的1.67倍，大大提高了速记行业的转录效率，加快了语音行业的发展。

次数包预付费

适用于调用量可预估的企业

免费调用量

200万次/企业账号

有效期 1年

并发量 50QPS（支持扩容）

技术支持

7*24小时

原价2400元

咨询我们 *.2折

调用量后付费

适用于不便预估调用量的企业