声纹云开发文档

Navigation :

语音标准

声纹云服务所提供的注册声纹，1：1验证，1：N识别等功能均需录入语音，录入的语音质量需满足一定标准才可得到高识别率。SpeakIn对所提供的2种声纹模型进行了标准化的区分，详细标准请参照下表：

数字模型

采集格式	8Khz、16KHZ采样率，16Bit采集精度，PCM无压缩编码WAV格式
设置用户	不低于12dB
信噪比	单声道
录音能量	正常音量
录音语速	注册语速：正常验证语速：正常
有效时长	注册有效录音时长大于3s*3句验证有效录音时长大于1.5s
录音内容	注册录音： 1、从9个数字（0，2，3，4，5，6，7，8，9）中随机抽取不重复的8个数字。 2、保证”2“，”5“两个数字不相邻。 3、确保每组数字不相同。验证录音 1、不重复的6个数字。 2、保证”2“，”5“两个数字不相邻。

短自由文本模型

采集格式	8Khz、16Khz采样率，16Bit采集精度，PCM无压缩编码WAV格式
设置用户	不低于12dB
信噪比	单声道
录音能量	正常音量
录音语速	注册语速：正常验证语速：正常
有效时长	注册有效录音时长大于6s*3句验证有效录音时长大于3s
录音内容	注册录音：重复3遍白日依山尽，黄河入海流。小微小微，今天天气怎么样？两岸猿声啼不住，轻舟已过万重山。验证录音：天王盖地虎，宝塔镇河妖野鸡闷头钻, 地上全是米