标注内容两个人的自然对话。每组对话45分钟左右,每组对话可能有一个或分成多个wav文件保存(文件名以ZXXXX开头,例如Z0001*.wav表示属于第1组对话)。质量要求l 文字错误率:3%以内n 注:文字错误率指语音内容标注错误,只要有一个字错,该条语音就算错。l 其他错误率:5%以内n 注:综合错误率指:除了语音内容以外的其他标注项错误,只要有一项错,该条语音就算错。标注工具praat.exe,输出textgrid格式的标注结果(TextGrid文件)标注要求根据不同说话人加时间戳(每个片段不超过10秒,如果说话人连续说了10秒以上,可按句子截成多个10秒以内的片段)并标出说话人的文字内容l 无效语音段写为W:听不清的、抢话的、噪音大、静音的语音片段均被认为无效l 语音内容必须和听到的语音完全一致,不能多字、少字、错字。l 阿拉伯数字要写成汉字形式,如“一二三”,而不是“123”。注意区分“一”和“幺”。“二”和“两”l 标注中只能含有中文、英文以及常用标点符号(空格、逗号、句号、问号)l 语气词: