Рус Eng Cn 翻译此页面:
请选择您的语言来翻译文章


您可以关闭窗口不翻译
图书馆
你的个人资料

返回内容

软件系统和计算方法
正确的文章链接:

针对说话人验证任务中一个数据集的特征重新训练神经网络的转移学习方法

Trofimova Varvara Sergeevna

ORCID: 0009-0008-5044-2321



146 Krasnoarmeyskaya str., room 509, Tomsk region, 634045, Russia

varvara.trofimova.01@mail.ru
Karshieva Polina Konstantinovna

ORCID: 0009-0004-8390-2348



146 Krasnoarmeyskaya str., room 509, Tomsk region, 634045, Russia

polinakarshieva1@gmail.com
Rakhmanenko Ivan Andreevich

ORCID: 0000-0002-8799-601X

博士学位 技术科学



146 Krasnoarmeyskaya str., room 509, Tomsk region, 634045, Russia

ria@fb.tusur.ru

DOI:

10.7256/2454-0714.2024.3.71630

EDN:

XHZCTS

评审日期

30-08-2024


出版日期

06-09-2024


注解: 该研究的主题是使用转移学习方法对数据集特征进行再训练的神经网络。 研究的对象是用于解决语音验证任务的机器学习方法。 该研究的目的是提高神经网络在语音验证任务中的效率。 本文以英文、俄文和中文为再培训过程准备了三个数据集。 此外,使用现代和预先训练的ResNetSE34L和ResNetSE34V2模型,进行了一项实验研究,旨在提高神经网络在通过任意短语验证说话者的任务中的效率。 特别注意使用微调方法优化神经网络的训练参数。  该研究的方法包括根据第1类和第2类相等误差的值,对说话者验证任务中数据集特征的再训练神经网络的有效性进行评估。 还进行了一些实验,在此期间改变了参数并使用了冻结层的技术。 通过选择epochs和学习速度实现了使用英语数据集时第1种和第2种相等误差的最大减少,误差减少了50%。 使用俄罗斯数据集的类似参数选择将误差减少了63.64%。 当使用中文数据集进行再训练时,在冻结完全连接的图层,改变学习率和优化器的实验中实现了最低值–误差减少了16.04%。 所获得的结果可用于语音验证系统的设计和开发以及用于教育目的。 还得出结论,转移学习方法在针对数据集的特征进一步训练神经网络方面是有效的,因为在压倒性的实验中,实现了EER的降低,这表明说话者识别的准确


出版日期:

转职培训, 微调, 数据集, 演讲者验证, 说话人识别, 特征提取, 语音处理, 神经网络, 深入学习, 模式识别