(图片来源网络,侵删)
工欲善其事,必先利其器标注工具是数据标注行业的基础,一款好用的标注工具是提升标注效率与产出高质量标注数据的关键常见的标注类型有:图片标注、语音标注、视频标注、2D框、语义分割、多边形分割、点标注、线标注、3D立方体标注.......当然不同的标注项目类型,用到的标注工具也是不同的,今天呢,就给大家介绍一款非常好用的语音处理分析软件--Praat不管是做语音识别的小伙伴还是做标注的小伙伴都可以学习一下,非常好用Praat语音学软件Praat 语音学软件,原名Praat: doing phonetics by computer,通常简称 Praat,是一款跨平台的多功能语音学专业软件,主要用于对数字化的语音信号进行分析、标注、处理及合成等实验,同时生成各种语图和文字报表该软件可以跨多个平台使用,在标Windows、Macintosh、 Linux、FreeBSD、Solaris、Chromebook等不同的操作系统它可以对语音信号进行采集、分析及标注,还可以对其进行滤波和转换目前,Praat已经成为世界上实验语音学、语言学、语言调查、语言处理等相关领域的研究人员普遍使用的软件如图所示是Prat语音数据标注窗口Praat可以做哪些事1.频谱分析2.基频分析3.强度分析4.共振峰分析5.语音标注6.语音参数调整和合成7.提前语音数据8.语音数据的统计分析是不是非常牛?这篇文章主要是要介绍标注语音时的工具使用,所以呢这里只介绍第五个语音标注Praat语音学软件使用· 导入语音文件点击 praat —>open —> read from file —> 找到你打开的文件 —> 打开,文件被添加在了praat 中;· 生成 TextGrid 文件利用Praat进行语音数据标注生成的标注对象是一个后级名为“TextGrid”的文件,它是一种“分段”文件,详细记录了语音的总时长、每一个标注层内所有标注区间的时长及标注内容等信息选中要转写的语音文件 —> annotate - —> To TextGrid... —>语音文件分层(三层)如下图—>点击 OK 生成 TextGrid 文件;· 编辑语音和 TextGrid 文件按Ctr同时选择wav和对应TextGrid, —> 选择View & Edit开始标注同时选中语音文件和 TextGrid 文件View & Edit;如图·TextGrid标注设置在弹出的TextGrid窗口中,选择File->Preferences,将Show IPA chart给去掉勾选,这样右边不会显示字符表Praat标注技巧·认识语图上的几个主要特征如果看不到基频线,共振峰线或者音强线,使用上菜单上的show pitch, show formant, show intersity即可·播放音频【1】按Tab键可以播放音频,Esc键取消【2】或按下方的灰色时间段也可以播放音频·标注分界线·给边界区域添加文字讲到这里也有人说了,全是英文版的,不好理解,标注起来可能会乱的,没关系,Praat也有汉化版,接下来我们就从标注方面看看汉化版的一个操作利用Praat做语音标注注:这里提示一下,软件会有很多快捷键,可以在使用的时候方便大家进行标注语音标注以上就是Praat在数据标注过程中比较重要的应用及技巧,虽然Praat软件提供了一种语音数据标注的方法,但在标注多段落的长语音时仍存在很大局限性另外,对于说话人角色、性别以及语音是否有效等属性,只能通过新建多个标注层来完成对语音的详细标注,这无疑大大降低了工作效率,总而言之,Praat软件可以实现语音数据标注的基本功能,但在处理复杂场景的语音数据标注任务时仍有不足,后面小编会继续给大家介绍其他的免费标注工具
0 评论