语音标准

声纹云服务所提供的注册声纹,1:1验证,1:N识别等功能均需录入语音,录入的语音质量需满足一定标准才可得到高识别率。SpeakIn对所提供的2种声纹模型进行了标准化的区分,详细标准请参照下表:

数字模型

采集格式 8Khz、16KHZ采样率,16Bit采集精度,PCM无压缩编码WAV格式
设置用户 不低于12dB
信噪比 单声道
录音能量 正常音量
录音语速 注册语速:正常
验证语速:正常
有效时长 注册有效录音时长大于3s*3句
验证有效录音时长大于1.5s
录音内容 注册录音:
1、从9个数字(0,2,3,4,5,6,7,8,9)中随机抽取不重复的8个数字。
2、保证”2“,”5“两个数字不相邻。
3、确保每组数字不相同。
验证录音
1、不重复的6个数字。
2、保证”2“,”5“两个数字不相邻。

短自由文本模型

采集格式 8Khz、16Khz采样率,16Bit采集精度,PCM无压缩编码WAV格式
设置用户 不低于12dB
信噪比 单声道
录音能量 正常音量
录音语速 注册语速:正常
验证语速:正常
有效时长 注册有效录音时长大于6s*3句
验证有效录音时长大于3s
录音内容 注册录音:重复3遍
白日依山尽,黄河入海流。
小微小微,今天天气怎么样?
两岸猿声啼不住,轻舟已过万重山。
验证录音:
天王盖地虎,宝塔镇河妖
野鸡闷头钻, 地上全是米