Баумтрог В.Э., Еськов А.В., Смирнов Ю.А. —
Прототип системы поиска и обнаружения экстремистских сообщений в социальной сети ВКонтакте
// Полицейская деятельность. – 2024. – № 5.
– 和。 98 - 109.
DOI: 10.7256/2454-0692.2024.5.71460
URL: https://e-notabene.ru/pdmag/article_71460.html
阅读文章
注释,注释: Объектом исследования являются нейронные сети, платформа ВКонтакте, мессенджер Telegram, язык программирования Python и его библиотеки, структурная схема модели компьютерной системы. Предметом исследования является компьютерная технология обнаружения экстремистского контента в текстовом виде и конкретных групп его содержащих в социальной сети ВКонтакте. Авторы подробно рассматривают структурную схему модели компьютерной системы, входящие в неё функциональные модули, иллюстрируют их взаимодействие. В работе используется предварительно обученная модель, предназначенная для обработки русского языка, приводятся условия обеспечения при помощи неё высокой точности распознавания неправомерного контента без признаков переобучения. В работе приводятся результаты проверки тестовых данных, подтверждающих работоспособность компьютерной системы. Предлагаемый прототип компьютерной системы обеспечивает его интеграцию с мессенджером Telegram, что повышает удобство использования и облегчает процесс формирования запросов и отчётов. В ходе исследования использовались общенаучные методы, анализ предметной области, создание модели компьютерной системы, бинарная классификация, эмпирическое тестирование прототипа, систематизация сведений.
Новизна исследования заключается в создании прототипа компьютерной системы поиска и обнаружения экстремистских сообщений в социальной сети ВКонтакте, использующей язык программирования Python и программный интерфейс ВКонтакте АРІ (VК АРІ). Основой прототипа компьютерной системы является нейронная сеть, работающая с библиотеками Тгаnsformers (предоставляет инструменты и интерфейсы для их простой загрузки и использования) и Тоrch (современная библиотека глубокого обучения). Особенностью компьютерной системы является возможность анализировать сообщения в социальной сети и подвергать их бинарной классификации на предмет содержания или не содержания в сообщениях противоправной информации. Основные выводы исследования показывают работоспособность системы, простоту и удобство её использования, возможность обнаружения неправомерного текстового контента. Отличительной особенностью прототипа является возможность обнаруживать неправомерный контент, изложенный с использованием сленговых выражений.
Abstract: The object of research is neural networks, the VKontakte platform, the Telegram messenger, the Python programming language and its libraries, and a block diagram of a computer system model. The subject of the study is a computer technology for detecting extremist content in text form and specific groups containing it on the VKontakte social network. The authors consider in detail the structural scheme of the computer system model, the functional modules included in it, and illustrate their interaction. The paper uses a pre-trained model designed for processing the Russian language, and provides conditions for ensuring high accuracy of recognition of illegal content without signs of retraining. The paper presents the results of checking the test data confirming the operability of the computer system. The proposed prototype of the computer system ensures its integration with the Telegram messenger, which increases usability and facilitates the process of generating queries and reports. The novelty of the research lies in the creation of a prototype of a computer system for searching and detecting extremist messages on the VKontakte social network using the Python programming language and the VKontakte API programming interface (VK API). The basis of the prototype computer system is a neural network that works with the Тгаnsformers and Тоrch. A special feature of the computer system is the ability to analyze messages on a social network and subject them to binary classification for the content or non-content of illegal information in messages. The main conclusions of the study show the efficiency of the system, the simplicity and convenience of its use, the possibility of detecting illegal text content. A distinctive feature of the prototype is the ability to detect illegal content presented using slang expressions.