实验课程

THIS NAME

实验课程

当前位置：首页 >> 实验课程 >> 正文

数据标注-语音数据标注

发布日期：2024-03-06 作者：井睿勍来源：点击：

语音数据标注

一、实验目的

1、语音标注的工具，利用标注工具进行数据标注。

二、实验设备与器件

PC机、Tempo大数据成长平台。

三、实验内容

相关知识

语音标注简介，语音标注方法，以及利用标注工具进行语音数据的标注。

1 语音标注方法

语音标注是数据标注行业中一种常见的标注类型，是由标注员对语音信息进行不断标注转写，让人工系统进行进一步学习，标注后的数据主要用于人工智能机器学习，相当于给计算机系统装上了“耳朵”，使其具备了“能听”的功能，使计算机可以拥有精准的语音识别能力。

语音标注主要包含了ASR语音转写、语音切割、语音清洗、清洗判定、声纹识别、音素标注、韵律标注、发音校对这八种常见的标注方式。语音标注和人工智能有着密切的联系，当前，语音识别技术已经在日常生活中多方面普及，如语音助手、智能音箱、智能客服等。

随着人工智能的发展，人机语音交互场景将向更多的方向延伸，在辨认精度、场景优化等层面、对语音辨认技术提出了更高的要求。近些年，人工智能不断发展，赋能人工智能的工具链却并不完善。数据作为人工智能迭代创新的核心要素之一，优化训练数据成为AI模型进一步提升准确率的重要方式。为推进AI应用高质量落地，人工智能基础数据服务商需要对数据采集、清洗、信息抽取、标注、质检、管理等环节进行更加精细的把控，以提供出更高质量的数据。