硅谷帮你这款神器专业课担心(硅谷这款帮你神器专业课)「硅谷教程」

大家在国外上课时，有没有遇到语速飞快的教授呢？还有那些带着印度口音，经常爆出专有名词的教授...着实听不懂啊喂
即便是顶着雅思听力8.0光环的同学，在面对他们时可能也会败下阵来…那么有没有什么好的解决方法呢？想必很多同学都想过，把一堂课给录音下来，课后通过暂停+慢速回听就好了
没错，但我们其实还可以更进一步，如果把整堂课的录音转换成文字，会不会方便很多？原先一两小时的录音在几分钟内就能浏览完，复习效率也可以大大提升了
语音识别在2021并不是累赘，你不用过于担心准确度，在一定程度上该项技术已经完全可以替代你的耳朵
otter语音识别转录的产品很多，我们以otter为例
这款软件支持多平台，你可以根据自己的喜好或习惯在IOS、android或网页中使用
使用方法很简单，在手机上：一、在app store或谷歌商店直接搜索「otter」下载二、下载安装好后，直接点击右下角的蓝色小话筒，即可开始录音三、在录音过程中，你还可以拍摄照片，同步记录下教授的板书、PPT
四、录音完成后，既能生成录音摘要，也能在一定程度上区分讲话者
你可以通过点击单词，来跳转录音对应位置
最后，它也支持导出文本
如果是web端，同样非常方便：登陆官网：[https://otter.ai/]，注册完成后，点击蓝色小话筒即可开始录制
同账号在不同平台，录音文件也是同步的，非常方便
我们来测试一下，该软件转录的准确度
这里我们选取了「嘴巴跟不上脑子」的天才马斯克，评价另一位天才乔布斯的片段（未加速）：视频加载中...转录结果：在马斯克如此快的语速下，转录结果也只是小部分单词错误，总体大差不差了
不知道这应该怪马斯克口齿不清，还是说这款软件还需要努力
在大多数语音转文字的产品都是付费的大环境下，otter这款产品提供了非常大度的免费版使用范围，它支持每月600min的实时转录（一个月后时间余额会再次充满），三个录音文件的转录，导出txt文件或音频文件，足以支持日常学习需求
专业版价格为8.33刀/月（按年订阅），12.99刀/月（按月订阅）如果你想要学生半价版或免费版，可以私信咨询
语音识别技术解析，otter对比同类产品语音识别不是一件非常简单的东西，它不仅需要强大的底层语音识别人工智能算法，也需要基于机器学习进行海量的用户数据训练
所以，虽然市面上层出不穷各类语音识别工具，但事实上，他们要么用的是大厂api，要么就是准确度不高的半成品
在世界最前沿的语音识别技术下，面对吐字清晰，相对不嘈杂的环境，机器识别的准确度已经超过了专业人类；而在嘈杂环境下，面对有口音的对话，人工智能跟人类也有极大的竞争力，但还需要不断努力提升
otter虽然只是一个地处硅谷的30人小团队，到现在也只成立了五年，但是识别精确度已经达到业内顶峰
值得一提，zoom的会议自动转录系统甚至没有用微软、谷歌这类超级巨头的，而是用的otter他们的语音识别技术
otter CEO Sam Liang（梁松）对此开心地表示：「所以这给我们的产品和服务质量加分不少
」Sam Liang 与 Zoom 创始人 Eric Yuan微软、苹果和谷歌三巨头的语音识别技术也很强，但他们提供的语音识别服务范围很局限，专业的技术都是提供给企业，而我们能够用的则是Cortana、Siri和Google Assistant
如果想用他们的语音识别技术用在记录教授的课上，方法也是有，大家可以试试：微软允许在边看看PowerPoint、word时，同时转录教授的讲话，但不方便导出；Google 允许在其Google doc中识别语音；苹果则需要用其自家「捷径」app来转换，但使用体验并不好
PowerPointGoogle doc此外，国内两家公司在这个领域做得也很突出，可以用在课堂上，大家可以将它们作为备选:一家是国内专做语音交互的科大讯飞，我们来看看识别准确度：准确地识别出了说话者
讯飞提供的语音识别功能，免费额度只有一点点，之后就要付费了
第二款产品是字节跳动推出的飞书妙记，识别准确度：精度稍差，但胜在他们免费