硅谷帮你这款神器专业课担心(硅谷这款帮你神器专业课)「硅谷教程」

大家在国外上课时,有没有遇到语速飞快的教授呢?还有那些带着印度口音,经常爆出专有名词的教授...着实听不懂啊喂
即便是顶着雅思听力8.0光环的同学,在面对他们时可能也会败下阵来…那么有没有什么好的解决方法呢?想必很多同学都想过,把一堂课给录音下来,课后通过暂停+慢速回听就好了
没错,但我们其实还可以更进一步,如果把整堂课的录音转换成文字,会不会方便很多?原先一两小时的录音在几分钟内就能浏览完,复习效率也可以大大提升了
语音识别在2021并不是累赘,你不用过于担心准确度,在一定程度上该项技术已经完全可以替代你的耳朵
otter语音识别转录的产品很多,我们以otter为例
这款软件支持多平台,你可以根据自己的喜好或习惯在IOS、android或网页中使用
使用方法很简单,在手机上:一、在app store或谷歌商店直接搜索「otter」下载二、下载安装好后,直接点击右下角的蓝色小话筒,即可开始录音三、在录音过程中,你还可以拍摄照片,同步记录下教授的板书、PPT
四、录音完成后,既能生成录音摘要,也能在一定程度上区分讲话者
你可以通过点击单词,来跳转录音对应位置
最后,它也支持导出文本
如果是web端,同样非常方便:登陆官网:[https://otter.ai/],注册完成后,点击蓝色小话筒即可开始录制
同账号在不同平台,录音文件也是同步的,非常方便
我们来测试一下,该软件转录的准确度
这里我们选取了「嘴巴跟不上脑子」的天才马斯克,评价另一位天才乔布斯的片段(未加速):视频加载中...转录结果:在马斯克如此快的语速下,转录结果也只是小部分单词错误,总体大差不差了
不知道这应该怪马斯克口齿不清,还是说这款软件还需要努力
在大多数语音转文字的产品都是付费的大环境下,otter这款产品提供了非常大度的免费版使用范围,它支持每月600min的实时转录(一个月后时间余额会再次充满),三个录音文件的转录,导出txt文件或音频文件,足以支持日常学习需求
专业版价格为8.33刀/月(按年订阅),12.99刀/月(按月订阅)如果你想要学生半价版或免费版,可以私信咨询
语音识别技术解析,otter对比同类产品语音识别不是一件非常简单的东西,它不仅需要强大的底层语音识别人工智能算法,也需要基于机器学习进行海量的用户数据训练
所以,虽然市面上层出不穷各类语音识别工具,但事实上,他们要么用的是大厂api,要么就是准确度不高的半成品
在世界最前沿的语音识别技术下,面对吐字清晰,相对不嘈杂的环境,机器识别的准确度已经超过了专业人类;而在嘈杂环境下,面对有口音的对话,人工智能跟人类也有极大的竞争力,但还需要不断努力提升
otter虽然只是一个地处硅谷的30人小团队,到现在也只成立了五年,但是识别精确度已经达到业内顶峰
值得一提,zoom的会议自动转录系统甚至没有用微软、谷歌这类超级巨头的,而是用的otter他们的语音识别技术
otter CEO Sam Liang(梁松)对此开心地表示:「所以这给我们的产品和服务质量加分不少
」Sam Liang 与 Zoom 创始人 Eric Yuan微软、苹果和谷歌三巨头的语音识别技术也很强,但他们提供的语音识别服务范围很局限,专业的技术都是提供给企业,而我们能够用的则是Cortana、Siri和Google Assistant
如果想用他们的语音识别技术用在记录教授的课上,方法也是有,大家可以试试:微软允许在边看看PowerPoint、word时,同时转录教授的讲话,但不方便导出;Google 允许在其Google doc中识别语音;苹果则需要用其自家「捷径」app来转换,但使用体验并不好
PowerPointGoogle doc此外,国内两家公司在这个领域做得也很突出,可以用在课堂上,大家可以将它们作为备选:一家是国内专做语音交互的科大讯飞,我们来看看识别准确度:准确地识别出了说话者
讯飞提供的语音识别功能,免费额度只有一点点,之后就要付费了
第二款产品是字节跳动推出的飞书妙记,识别准确度:精度稍差,但胜在他们免费
硅谷帮你这款神器专业课担心(硅谷这款帮你神器专业课)
(图片来源网络,侵删)

联系我们

在线咨询:点击这里给我发消息