一种耳语说话人识别模型训练方法和装置


专利名称

一种耳语说话人识别模型训练方法和装置

所属单位

智能科学与技术学院

通讯地址

北京市西城区展览路1号

联系人

科学技术发展研究院

电话

010-68322482

专利发明人

周若华

专利号

CN202410250740.4

专利类型

发明授权

专利状态

授权且有效

专利简介

本申请提供一种耳语说话人识别模型训练方法和装置。本申请提供的耳语说话人识别模型训练方法,包括:基于迁移学习构建初始耳语说话人识别模型,所述迁移学习对象至少包括由正常语音音频预训练好的TDNN模型;建立第一耳语数据集,第一耳语数据集中至少包括多个第一耳语样本,每个第一耳语样本中至少包括耳语语音音频、与耳语语音音频为同一说话人的正常语音音频和耳语语音音频对应的说话人标识;对第一耳语数据集进行数据增强,获得第二耳语数据集;混合第一耳语数据集和第二耳语数据集,构建第三耳语数据集,利用第三耳语数据集训练初始耳语说话人识别模型,得到最终的耳语说话人识别模型。本申请提供的耳语说话人识别模型训练方法和装置,可提高耳语说话人识别准确性和鲁棒性。
Baidu
map