Рус Eng Cn 翻译此页面:
请选择您的语言来翻译文章


您可以关闭窗口不翻译
图书馆
你的个人资料

返回内容

安全问题
正确的文章链接:

使用选定的机器学习方法对自然语言文本进行有效分类并确定语音音调

Pleshakova Ekaterina Sergeevna

ORCID: 0000-0002-8806-1478

博士学位 技术科学

联邦国家教育预算高等教育机构"俄罗斯联邦政府下的金融大学"信息安全系副教授

125167, Russia, Moscow, 4th Veshnyakovsky Ave., 12k2, building 2

espleshakova@fa.ru
Gataullin Sergei Timurovich

博士学位 经济学

联邦国家教育预算高等教育机构"俄罗斯联邦政府下的金融大学"信息技术学院副院长

8A Aviamotornaya str., Moscow, 111024, Russia

stgataullin@fa.ru
Osipov Aleksei Viktorovich

博士学位 物理和数学

联邦国家教育预算高等教育机构"俄罗斯联邦政府下的金融大学"信息安全系副教授

125167, Russia, Moscow, 4th veshnyakovsky str., 4, building 2

avosipov@fa.ru
Romanova Ekaterina Vladimirovna

博士学位 物理和数学

俄罗斯联邦政府下属金融大学数据分析与机器学习系副教授

125167, Russia, Moscow, 49/2 Leningradsky Ave.

EkVRomanova@fa.ru
Samburov Nikolai Sergeevich

俄罗斯联邦政府金融大学数据分析与机器学习系学生

125167, Russia, Moscow, 49/2 Leningradsky Ave.

ncsamburov@mail.ru

DOI:

10.25136/2409-7543.2022.4.38658

EDN:

UPWMCV

评审日期

23-08-2022


出版日期

30-12-2022


注解: 目前,正在生成大量文本,迫切需要将它们组织在一定的结构中,以便执行分类并正确定义类别。 作者详细考虑了该主题的这些方面,如自然语言文本的分类和社交网络Twitter中文本音调的定义。 社交网络的使用除了具有众多优点外,还具有负面特征,即用户面临众多网络威胁,如个人数据泄露,网络欺凌,垃圾邮件,假新闻。 分析文本调性的主要任务是确定情感丰满和着色,这将揭示语音的负色调性。 情绪着色或情绪纯粹是个人特征,因此作为识别工具具有潜力。   自然语言文本分类的主要目的是从文本中提取信息,并使用机器学习方法的搜索,分类等过程。 作者分别选择并比较了以下模型:逻辑回归,多层感知器,随机森林,朴素贝叶斯方法,K-最近邻方法,决策树和随机梯度下降。 然后我们相互测试和分析了这些方法。 实验结论表明,使用TF-IDF评分进行文本矢量化并不总是提高模型的质量,或者对于单个度量来说这样做,结果是特定模型的剩余度量的指标下降。 完成工作目的的最佳方法是随机梯度下降。


出版日期:

人工智能, 机器学习, 神经网络, 个人资料, 网络犯罪, 社交网络, 网络威胁, 文本分类, 文本的音调, 滥发电邮