Рус Eng Cn 翻译此页面:
请选择您的语言来翻译文章


您可以关闭窗口不翻译
图书馆
你的个人资料

返回内容

软件系统和计算方法
正确的文章链接:

语义接近句子搜索任务信息性特征的统计评价

Glazkova Anna Valer'evna

博士学位 技术科学

秋明州立大学软件系高级讲师

625007, Russia, Tyumenskaya oblast', g. Tyumen', ul. Proezd 9 Maya, 7, of. 94

anna_glazkova@yahoo.com

DOI:

10.7256/2454-0714.2020.1.31728

评审日期

15-12-2019


出版日期

05-03-2020


注解: 本文提出了定量和二元特征的信息性评价结果,以解决语义接近句子的搜索问题。 考虑了三种类型的特征:建立在单词的向量表示(根据Word2Vec模型),基于数字和结构化信息的提取并反映文本的定量特征。 作为信息性的指标,使用具有特征的实例之间的意译比例和具有特征的意译比例(对于二元特征),以及使用累积频率方法的估计(对于定量特征)。 评估是在俄语意译语料库上进行的。 本文考虑的特征集已被测试为两种机器学习模型的输入数据,以确定语义上接近的句子:支持向量机(Svm)和循环神经网络模型。 第一个模型只接受考虑的一组特征作为输入参数,第二个–序列形式的文本和一组特征作为附加输入。 模型的质素分别为67.06%(以F计)及69.49%(以准确度计)及79.85%(以F计)及74.16%(以准确度计)。 在工作中获得的结果与2017在确定俄语意译的竞争中提出的系统的最佳结果相当(F-measure中的第二个结果,准确性的第三个结果)。 该论文提出的结果既可用于实现自然语言中语义接近的文本片段的搜索模型,也可用于从计算语言学的角度分析俄语意译。


出版日期:

语义接近, 文本分类, 搜索意译, 神经网络, 支持向量机, 信息功能, 累积频率, 统计评估, 特征选择, 机器学习