基于手写动态的用户认证神经网络模块的开发 Раскраски по номерам для детей
Рус Eng Cn 翻译此页面:
请选择您的语言来翻译文章


您可以关闭窗口不翻译
图书馆
你的个人资料

返回内容

控制论与编程
正确的文章链接:

基于手写动态的用户认证神经网络模块的开发

Dikii Dmitrii Igorevich

ITMO大学研究生

197101, Russia, Sankt-Peterburg, g. Cankt-Peterburg, pr. Kronverkskii, 49

dimandikiy@mail.ru
Grishentsev Aleksei Yurevich

博士学位 药店

ITMO大学副教授

197101, Russia, g. Saint Petersburg, pr. Kronverkskii, 49

grishentcev@ya.ru
Savchenko-Novopavlovskaya Sof'ya Leonidovna

ITMO大学硕士

197101, Russia, g. Cankt-Peterburg, pr. Kronverkskii, 49

Novopalych@hotmail.com
Nechaeva Natalya Viktorovna

ITMO大学硕士

197101, Russia, g. Saint Petersburg, pr. Kronverkskii, 49

exotica1980@mail.ru
Eliseeva Valeria Valeryevna

ITMO大学硕士

197101, Russia, g. Saint Petersburg, pr. Kronverkskii, 49

valeria_eliseeva@mail.ru
Artemeva Viktoriia Denisovna

I.康德波罗的海联邦大学学生

238300, Russia, Kaliningradskaya oblast', g. Kaliningrad, ul. A. Nevskogo, 14a

vika_med2019@mail.ru

DOI:

10.25136/2644-5522.2018.1.19801

评审日期

20-07-2016

出版日期

27-02-2018

注解: 本文致力于开发和研究神经网络模块的结构,该模块是用于分析手写动态参数的各种信息系统用户的身份验证系统的一部分。 还考虑了神经网络模块训练的算法。 正在开发的神经网络模块要解决的主要任务是实现基于诸如笔迹样本沿横坐标和纵坐标轴的运动轨迹的笛卡尔坐标以及时间截止等输入特征向量 对于工作中考虑的神经网络模块的结构,进行了一个实验,其中将各种体积的手写样本提交给输入,以确定最稳定的。 描述了神经网络模块的数学模型及其训练的遗传算法。 本文还概述了基于手写动态的其他用户身份验证软件中使用的神经网络模块的结构。 根据实验结果给出了模块结构选择的理由。 神经网络模块的软件实现是用Java编程语言完成的。


关键词:

身份验证, 笔迹动态, 人工神经网络, 遗传算法, 感知器,感知器, 机器学习, 二元分类器, 生物测定学, 签名, 密码

Введение

По данным отчета за 2015 год аналитического центра InfoWatch были украдены более 950 миллионов записей, которые содержали различного рода ценную информацию, в том числе персональные данные, платежную информацию. Утечка подобной информации является непосредственной угрозой информационной безопасности для многих предприятий, независимо от сферы их занятости и расположения [1]. Компания Cisco провела исследование тенденций использования средств обеспечения информационной безопасности, в результате которого выяснилось, что чаще всего для обеспечения информационной безопасности применяются межсетевые экраны (65 %), за ними следуют средства предотвращения утечки данных (56 %) и только потом средства аутентификации (53 %) [2]. Таким образом, следует уделять огромное внимание угрозам, свойственным несанкционированному доступу к информации, в том числе через глобальную сеть Интернет. Основным средством предотвращения подобного рода угроз является система аутентификации, в которой каждому пользователю информационной системы предоставляется уникальная идентифицирующая его информация. Утечка или компрометация такой информации, позволяет реализовать угрозу получения доступа к конфиденциальной информации, например, адрес электронной почты, адрес проживания, номер телефона, в некоторых случаях платежная информация. Современные системы аутентификации, основанные на цифро-буквенных паролях, применявшиеся многие десятилетия назад, имеют свои несомненные достоинства. Но существенным их недостатком является то, что комбинацию букв и цифр все-таки можно подобрать или выведать у пользователя информационной системы путем социального инжиниринга. Взамен цифро-буквенных парольных систем вскоре стали применять системы, которые используют многофакторную аутентификацию. На данный момент уже никого не удивить технологиями краткосрочного пароля, который высылается на конкретный мобильный номер пользователя. Другим решением данной проблемы является применение биометрической аутентификации. В качестве пароля в них используется отличительная черта человека, например, рисунок радужной оболочки глаза, отпечаток пальца или параметры голоса.

С давних времен человек использовал свою отличительную черту, а именно рукописную подпись, в качестве доказательства того факта, что именно он совершил какое-либо действие, например, подписание договора. Визуально сравнивая несколько образцов почерка или подписей, можно с некоторой вероятностью утверждать принадлежали ли они одному и тому же человеку. С развитием компьютерных технологий стало возможным, кроме обычного автоматизированного сравнения изображений образцов почерка, использовать динамические характеристики написания некоторого парольного слова в качестве идентифицирующей человека информации.

Цели работы

Целью настоящей работы является разработка нейросетевого модуля, принимающего данные от пользователя, являющегося классификатором системы аутентификации по динамике рукописного почерка.

Для достижения поставленной цели решались следующие задачи:

1. анализ существующих тенденций использования искусственных нейронных сетей;

2. разработка структуры нейросетевого модуля;

3. программная реализация нейросетевого модуля.

Обзор

Как показывает анализ средств информационной безопасности, задача аутентификации пользователя информационной системы по динамическим характеристикам почерка является актуальной.

Необходимо договориться о терминологии и определить те параметры, которые можно считать биометрическими показателями почерка, которые анализируются во время функционирования процесса аутентификации. Полноценные программные продукты, реализующие аутентификацию на основе анализа характеристик рукописного почерка, от российских и зарубежных производителей можно разделить на два вида: статические и динамические. Статические системы или offline-системы — это такие системы, которые работают только с отсканированным изображением образца рукописного почерка человека. К недостаткам таких систем можно отнести его не применимость к процессу аутентификации пользователя в информационной системе в режиме онлайн. Динамические системы оценки параметров рукописного почерка основаны на измерении характеристик в процессе написания текста. Очевидно, что системы аутентификации, работающие с динамическими характеристиками рукописного почерка, требуют широкого функционала устройств ввода и обработки вводимой информации, например, возможность принимать точные декартовые координаты траектории образца почерка x(t), y(t), оценивать давление на поверхность написания z(t) и угол наклона θ(t), скорость перемещения пера dx(t)/dt, dy(t)/dt и другие. Динамические системы обладают явными преимуществами перед статическими, однако их основным недостатком является зависимость от временного параметра, т.е. зависимость от частоты обработки сообщений об изменении положении пера относительно поверхности написания.

Ввиду того, что нейросетевой модуль разрабатывается, как составной элемент системы аутентификации, применение которой предполагается с использованием различных устройств ввода, большинство из которых не имеет возможности определять силу давления и угол наклона между пером и плоскостью, то в качестве входных данных для искусственной нейронной сети будут выступать только декартовые координаты и значения времени.

Искусственные нейронные сети уже несколько десятилетий используются в качестве классификаторов при решении задач автоматизированного распознавания образов. Однако до сих пор нет четкого алгоритма построения структуры искусственной нейронной сети. На данный момент предложено множество архитектур и методов построения. Наиболее часто применяется многослойный перцептрон, модель которого впервые предложил Розенблат. В работах [3-6] описано применение многослойного перцептрона применительно к распознаванию образов рукописного почерка, как в статическом, так и в динамическом режимах. Сравнительные характеристики различных вариантов исполнения многослойных перцептронов приведены в работах [7-8]. Согласно данным работы [7] многослойный перцептрон с двумя скрытыми слоя более стабилен, чем многослойный перцептрон с одним скрытым слоем, а время его обучения существенно не отличается (см. табл. 1). Работа многослойного перцептрона оптимальна в случае, когда число входных нейронов примерно в два раза больше, чем в скрытых слоях.

Таблица 1. – Сравнительная характеристика обучения многослойных перцептронов с одним и двумя скрытыми слоями.

Структура

Число итераций, ед.

Относительное время, %

Многослойный перцептрон с одним скрытым слоем

1000

60.1

Многослойный перцептрон с двумя скрытыми слоями

1200

100

Другим важным моментом, которому стоит уделить внимание, является выбор функции активации. Наибольшее распространение получила сигмоидальная функция активации (формула 1):

` f(x)=1/(1-e^(-x))`; (1)

Однако в некоторых работах встречается пороговая активационная функция [8], также нередко применяется радиально-базисная функция [9-11].

Чаще всего применяются только сети с прямым распространением сигнала, например работа [12].

Также встречаются случаи применения искусственных нейронных сетей с временной задержкой [13] и сети, основанные на нечеткой логике [14].

Искусственные нейронные сети являются «обучаемыми учителем», что означает присутствие алгоритма обучения. В большинстве работ применяется алгоритм обратного распространения ошибки [15-18]. Также распространены различного рода генетические алгоритмы обучения искусственных нейронных сетей [14].

Метод

Изначально из всех данных полученных от пользователя формируются 3 отдельных массива входных данных: координаты по оси абсцисс, координаты по оси ординат и временные метки. Каждый массив представляет собой набор входных данных для искусственной нейронной сети. Таким образом, для каждого пользователя организовывается три одинаковых по структуре искусственных нейронных сети, каждая из которых отвечает за соответствующий параметр введенной пользователем рукописной информации. На основании трудов, рассмотренных выше, были предложены несколько вариантов структуры искусственной нейронной сети. Однако, во всех случаях она представляет собой многослойный перцептрон прямого распространения сигналов без обратных связей. Каждый нейрон связан синоптическим весом с каждый нейроном следующего слоя. Структура нейронной сети представляет собой композицию четырех слоев: первый слой служит для входных данных, второй и третий слои – скрытые, а четвертый слой является выходным и состоит из единственного нейрона. Одного нейрона на выходном слое вполне достаточно, чтобы организовать бинарный классификатор. Ввиду того, что динамика почерка у каждого человека индивидуальна, то идентификатором пользователя может быть последовательность данных различных размеров. То есть для каждого пользователя количество нейронов входного слоя может быть любым из интервала [0;∞). Согласно работе [7], количество нейронов в скрытых слоях должно быть в два раза меньше, чем входных данных. Таким образом было выдвинуто две гипотезы. Первая: количество нейронов в первом скрытом слое (N/2) переменно и в два раза меньше, чем переменное количество (N) нейронов входного слоя. Вторая: вектор признаков пользователя разделяется на Z участков одинаковой длины (число Z также как и в первой структуре индивидуально для каждого пользователя), количество входных нейронов фиксировано (N=const), количество нейронов в первом скрытом слое также фиксировано и в два раза меньше количества нейронов во входном слое (N/2=const). Второй скрытый слой состоит из 5 нейронов. Изображения предложенных структур приведены для одного параметра (например по оси абсцисс) на рисунках 1а и 1б соответственно.

untitled_diagram_2_31

Рисунок 1 – Структуры искусственных нейронных сетей: а) искусственная нейронная сеть из N входных нейронов и N/2 нейронов первого скрытого слоя, б) композиция из Z≈N/10 нейронных сетей с 10 входными нейронами и 5 нейронами в первом скрытом слое.

Активационная функция всех нейронов, как и во многих проанализированных работах, это сигмоид (формула 1).

Обе предложенные структуры нейросетевого модуля системы аутентификации по динамике почерка являются «обучаемыми учителем». Обучение состоит в поиске значений весовых коэффициентов (на рисунках 1а и 1б изображены стрелочками). Из двух рассмотренных методов обучения был выбран генетический алгоритм ввиду того, что он обладает способностью, в отличие от метода обратного градиентного спуска, найти глобальное решение, а не локальное.

Значение каждого нейрона, соответственно и нейрона выходного слоя рассчитывается по формуле 1, аргументом которой является выражение формула 2.

`X=sum_(i=1)^n(w_(i)m_(i))` (2)

где n – количество нейронов в предыдущем слое, wi – значение весового коэффициента из интервала [-1;1], который соединяет i-ый нейрон предыдущего слоя с нейроном, значение которого вычисляется, mi- значение соответствующего нейрона предыдущего слоя.

Алгоритм обучения можно представить следующим образом (также представлен на рисунке 2):

Шаг 1. Генерация K наборов весовых коэффициентов. Каждое значение выбирается случайным образом из интервала [-1;1], опытным путем K определено как 50.

Шаг 2. Определение значения на выходе нейронной сети с каждым сгенерированным набором весовых коэффициентов.

Шаг 3. Если значение на выходе нейронной сети для какого-либо набора весовых коэффициентов находится в интервале [1-d;1], то такой набор сохраняется и алгоритм завершает свою работу. Значение d - пороговое значение, которое задается при проектировке обучения.

Шаг 4. Если ни одно из значений на выходе нейронной сети не входит в вышеупомянутый интервал, тогда наборы модифицируются.

Шаг 5. Модификация:

Этап 1. Селекция - выбор пар наборов весовых коэффициентов для дальнейших операций.

Этап 2. Скрещивание - обмен значениями весовых коэффициентов внутри каждой отобранной парой.

Этап 3. Мутация - с определенной долей вероятности заменить значение любого весового коэффициента на случайно сгенерированное число из интервала [-1;1].

Шаг 6. Повторить Шаги 2-5 до тех пор, пока Шаг 3 не будет завершен со значением «Успех».

Для выявления лучшей структуры нейросетевого модуля был проведен эксперимент по определению наилучшей обучаемости. Для этого на вход двух искусственных нейронных сетей со структурами, показанными на рисунках 1а и 1б, подавались одни и те же данные. Результаты на момент 1500-ой итерации обучения представлены в таблице 2.

_3_1

Рисунок 2 – Блок-схема генетического алгоритма обучения нейросетевого модуля.

Таблица 2. – Сравнительная характеристика обучения многослойных перцептронов с различными структурами.

Структура

Количество образцов, предъявленных для обучения, шт.

Количество весовых коэффициентов

Время обучения, мс.

Статус на момент 1500-ой итерации

Многослойный перцептрон изображенный на рисунке 1а

2

6735

3831

Успех

3

3603

5838

Успех

4

3831

14249

Успех

5

7044

15183

Успех

Многослойный перцептрон изображенный на рисунке 1б

2

2295

10651

Успех

3

2295

14787

Неудача

4

2295

13078

Неудача

5

3060

18239

Неудача

Из двух рассмотренных структур нейросетевого модуля, согласно данным таблицы 2, вторая показала наименьшую способность к обучению, стабильности и функционированию, а также требует больших временных затрат . Таким образом, можно сделать вывод о том, что для нейросетевого модуля аутентификации пользователя по динамике почерка, оптимально использовать архитектуру, которая изображена на рисунке 1а.

Заключение

В ходе проведения исследования были проанализированы существующие тенденции использования искусственных нейронных сетей, применительно к решению задачи распознавания пользователей по динамике почерка. Была разработана структура нейросетевого модуля, причем определено необходимое количество нейронов на входном и первом скрытом слое. Разбиение векторов признаков пользовательских данных на более мелкие отрезки приводит к значительному ухудшению способности нейронных сетей к обучению. Также в ходе проведения работ была выполнена программная реализация нейросетевого модуля с отобранной структурой. Разработанный нейросетевой модуль, являющийся составной частью системы аутентификации пользователя по динамическим характеристикам почерка и построенный на модели многослойного перцептрона, полностью выполняет возложенные на него задачи бинарного классификатора.