即便是顶着雅思听力8.0光环的同学,在面对他们时可能也会败下阵来…那么有没有什么好的解决方法呢?想必很多同学都想过,把一堂课给录音下来,课后通过暂停+慢速回听就好了没错,但我们其实还可以更进一步,如果把整堂课的录音转换成文字,会不会方便很多?原先一两小时的录音在几分钟内就能浏览完,复习效率也可以大大提升了语音识别在2021并不是累赘,你不用过于担心准确度,在一定程度上该项技术已经完全可以替代你的耳朵otter语音识别转录的产品很多,我们以otter为例这款软件支持多平台,你可以根据自己的喜好或习惯在IOS、android或网页中使用使用方法很简单,在手机上:一、在app store或谷歌商店直接搜索「otter」下载二、下载安装好后,直接点击右下角的蓝色小话筒,即可开始录音三、在录音过程中,你还可以拍摄照片,同步记录下教授的板书、PPT四、录音完成后,既能生成录音摘要,也能在一定程度上区分讲话者你可以通过点击单词,来跳转录音对应位置最后,它也支持导出文本如果是web端,同样非常方便:登陆官网:[https://otter.ai/],注册完成后,点击蓝色小话筒即可开始录制同账号在不同平台,录音文件也是同步的,非常方便我们来测试一下,该软件转录的准确度这里我们选取了「嘴巴跟不上脑子」的天才马斯克,评价另一位天才乔布斯的片段(未加速):视频加载中...转录结果:在马斯克如此快的语速下,转录结果也只是小部分单词错误,总体大差不差了不知道这应该怪马斯克口齿不清,还是说这款软件还需要努力在大多数语音转文字的产品都是付费的大环境下,otter这款产品提供了非常大度的免费版使用范围,它支持每月600min的实时转录(一个月后时间余额会再次充满),三个录音文件的转录,导出txt文件或音频文件,足以支持日常学习需求专业版价格为8.33刀/月(按年订阅),12.99刀/月(按月订阅)如果你想要学生半价版或免费版,可以私信咨询语音识别技术解析,otter对比同类产品语音识别不是一件非常简单的东西,它不仅需要强大的底层语音识别人工智能算法,也需要基于机器学习进行海量的用户数据训练所以,虽然市面上层出不穷各类语音识别工具,但事实上,他们要么用的是大厂api,要么就是准确度不高的半成品在世界最前沿的语音识别技术下,面对吐字清晰,相对不嘈杂的环境,机器识别的准确度已经超过了专业人类;而在嘈杂环境下,面对有口音的对话,人工智能跟人类也有极大的竞争力,但还需要不断努力提升otter虽然只是一个地处硅谷的30人小团队,到现在也只成立了五年,但是识别精确度已经达到业内顶峰值得一提,zoom的会议自动转录系统甚至没有用微软、谷歌这类超级巨头的,而是用的otter他们的语音识别技术otter CEO Sam Liang(梁松)对此开心地表示:「所以这给我们的产品和服务质量加分不少」Sam Liang 与 Zoom 创始人 Eric Yuan微软、苹果和谷歌三巨头的语音识别技术也很强,但他们提供的语音识别服务范围很局限,专业的技术都是提供给企业,而我们能够用的则是Cortana、Siri和Google Assistant如果想用他们的语音识别技术用在记录教授的课上,方法也是有,大家可以试试:微软允许在边看看PowerPoint、word时,同时转录教授的讲话,但不方便导出;Google 允许在其Google doc中识别语音;苹果则需要用其自家「捷径」app来转换,但使用体验并不好PowerPointGoogle doc此外,国内两家公司在这个领域做得也很突出,可以用在课堂上,大家可以将它们作为备选:一家是国内专做语音交互的科大讯飞,我们来看看识别准确度:准确地识别出了说话者讯飞提供的语音识别功能,免费额度只有一点点,之后就要付费了第二款产品是字节跳动推出的飞书妙记,识别准确度:精度稍差,但胜在他们免费
(图片来源网络,侵删)
0 评论