Скворцова Е.Б., Бочкарев А.И., Пепеляева М.А. —
Статистический анализ речевых формул оправдания в английском языке при помощи SVM-классификатора
// Филология: научные исследования. – 2018. – № 4.
– 和。 302 - 307.
DOI: 10.7256/2454-0749.2018.4.26268
URL: https://e-notabene.ru/fmag/article_26268.html
阅读文章
注释,注释: Целью работы является разработка релевантного и точного инструментария для анализа статистических характеристик различных классов речевых актов.
Объектом исследования будут речевые формулы оправдания в английском языке. Предмет исследования – статистические характеристики указанных формул. Ранее нами были проанализированы речевые формулы извинения в английском языке и проведена формализация кластера оправданий, благодаря чему удалось получить основные формулы, в соответствии с которыми могут строиться оправдания. Особое внимание уделяется разработке точного инструментария, недостатком которого характеризуется современное состояние лингвистики. В ходе анализа применяются как лингвистические, так и математические методы. Для решения задачи распознавания оправданий используется классификатор на основе опорных векторов. Новизна исследования заключается в том, что до сих пор не было разработано инструментария, который с адекватной точностью позволил бы выделять тексты, содержащие определенные речевые акты. В результате была достигнута точность классификации 94%, что является хорошим показателем. Полученные результаты могут быть использоваться для статистического анализа других речевых формул помимо оправдания. В дальнейшем предполагается расширить обучающую и тестовую выборку с целью увеличения точности классификации.
Abstract: The aim of the research is the development of a relevant and accurate instrument to analyse statistical characteristics of speech acts of different kinds. The object of the research is English apology speech formulas. The subject of the research is the statistical characteristics of the aforesaid formulas. The authors have analyzed English apology speech formulas and formalized an apology cluster, as a result, they have discovered the basic formulas apologies can be built on. In this article the authors are focusing on the development of accurate instruments that is so needed in modern linguistic studies. In the course of their research the authors have used both linguistic and mathematical methods. To recognize apologies, the authors apply a classifier that is based on reference vectors. The novelty of the research is caused by the fact that valid instruments to define particular speech acts in texts have not been yet created. As a result, the authors achieve 94% of the accuracy of their classification which is a good indicator. The results received can be used for statistical analysis of other speech formulas besides apologies. In the future the authors suggest to extend groups of respondents in order to increase accuracy of classification.