语音标准
声纹云服务所提供的注册声纹,1:1验证,1:N识别等功能均需录入语音,录入的语音质量需满足一定标准才可得到高识别率。SpeakIn对所提供的2种声纹模型进行了标准化的区分,详细标准请参照下表:
数字模型
采集格式 | 8Khz、16KHZ采样率,16Bit采集精度,PCM无压缩编码WAV格式 |
---|---|
设置用户 | 不低于12dB |
信噪比 | 单声道 |
录音能量 | 正常音量 |
录音语速 | 注册语速:正常 验证语速:正常 |
有效时长 | 注册有效录音时长大于3s*3句 验证有效录音时长大于1.5s |
录音内容 | 注册录音: 1、从9个数字(0,2,3,4,5,6,7,8,9)中随机抽取不重复的8个数字。 2、保证”2“,”5“两个数字不相邻。 3、确保每组数字不相同。 验证录音 1、不重复的6个数字。 2、保证”2“,”5“两个数字不相邻。 |
短自由文本模型
采集格式 | 8Khz、16Khz采样率,16Bit采集精度,PCM无压缩编码WAV格式 |
---|---|
设置用户 | 不低于12dB |
信噪比 | 单声道 |
录音能量 | 正常音量 |
录音语速 | 注册语速:正常 验证语速:正常 |
有效时长 | 注册有效录音时长大于6s*3句 验证有效录音时长大于3s |
录音内容 | 注册录音:重复3遍 白日依山尽,黄河入海流。 小微小微,今天天气怎么样? 两岸猿声啼不住,轻舟已过万重山。 验证录音: 天王盖地虎,宝塔镇河妖 野鸡闷头钻, 地上全是米 |