Сетевое издание
Международный студенческий научный вестник
ISSN 2409-529X

МОДЕЛЬ ДЕШИФРОВКИ ИСТОРИЧЕСКИХ РУКОПИСНЫХ ДОКУМЕНТОВ

Ануприенко М.A. 1
1 Ставропольский государственный аграрный университет
1. Вдовин В.А., Муравьёв А.В., Метод адаптивной бинаризации растрового изображения. – М: изд-во «Москва», 2012 – №4. – C. 110-124.
2. Yanovskiy A.A., Simonovsky A.Ya., Kholopov V.L., Chuenkova I.Yu. Heat Transfer in Boiling Magnetic Fluid in a Magnetic Field // Solid State Phenomena. – № 233-234. – 2015. – p.339-343.
3. Yanovskii A.A., Simonovskii A.Ya., Klimenko E.M. On the Influence of the Magnetic Field upon Hydrogasdynamic Processes in a Boiling Magnetic Fluid // Surface Engineering and Applied Electrochemistry. – 2014. – Vol. 50, No. 3, pp. 260–266.
4. Рабочая тетрадь «Математическая логика и теория алгоритмов» (учебное пособие) / Т.А. Гулай, С.В. Мелешко, И.А. Невидомская, А.А. Яновский. // Международный журнал прикладных и фундаментальных исследований. – 2014. – №8-2. – С. 169.
5. Яновский А.А., Симоновский А.Я., Савченко П.И. моделирование гидрогазодинамических процессов в кипящей магнитной жидкости // Информационные системы и технологии как фактор развития экономики региона: сб. науч. трудов. – Ставрополь, 2013. – С. 159-163.
6. Яновский А.А. Управление теплообменными процессами при кипении магнитной жидкости на неограниченной поверхности при помощи магнитного поля / А.А. Яновский, А.Я. Симоновский // Физическое образование в вузах. – 2012. – Т.18, №1. – С. 35-36.
7. Яновский А.А., Симоновский А.Я. Математическое моделирование формы пузырька пара в кипящей магнитной жидкости // Научно-практическая конференция «Финансово-экономические и учетно-аналитические проблемы развития региона». – Ставрополь, 2013. – С. 490-493.
8. Яновский А.А. Тепло- и массоперенос поле в кипящей магнитной жидкости в однородном магнитном поле / А.А. Яновский, А.Я. Симоновский, И.Ю. Чуенкова // Труды XI Международной конференции «Перспективные технологии, оборудование и аналитические системы для материаловедения и наноматериалов». – Курск, 2014. Ч.1. – С. 252-257.
9. Яновский А.А. К вопросу о теплообмене в кипящей магнитной жидкости / Яновский А.А., Симоновский А.Я., Холопов В.Л. // ХI Всероссийский съезд по фундаментальным проблемам теоретической и прикладной механики: сборник докладов / Составители: Д.Ю. Ахметов, А.Н. Герасимов, Ш.М. Хайдаров, 2015. – С. 4336-4338.
10. Яновский А.А., Спасибов А.С. Математическое моделирование процессов в кипящих намагничивающихся средах // Современные наукоемкие технологии. – 2014. – №5-2. – С. 183-186.

Автоматизированное анализ рукописных текстов востребован в разных сферах деятельности человека. Существует не малое количество различных исследований в этой области, направленных на решение этой задачи. В свой статье я приводу пример математической модели дешифровки исторических рукописных документов, которая лежит в основе многих разработок. Распознавание различных текстов проводится на базе полученной информации о символе, а также оперяясь на информацию, полученную из текстов самого автора.

Обозначим через prakt62.wmf последовательность рукописных символов. Довольно часто рукописные символы распознаются неоднозначно. Для символа xk обозначим через prakt63.wmf множество его возможных распознаваний. Каждому опознанному символу prakt64.wmf определяются его возможные трактовки prakt65.wmf. Тогда распознанный текст примет вид prakt66.wmf. Нужно вычислить такой набор индексов, чтобы вероятность верного распознавания была максимальной.

prakt67.wmf,

где максимум берется по всем prakt68.wmf, prakt69.wmf..., prakt70.wmf prakt71.wmf.

Используя формулы умножения вероятностей, она равна:

prakt72.wmf. (1)

Оценим вероятность prakt73.wmf. Оценка сомножителя формулы (1) при prakt74.wmf выглядит таким образом:

prakt75.wmf. (2)

Для k<3, оценка вероятности облегчается. Полученное уравнение представляет собой обыкновенное дифференциальное нелинейное уравнение второго порядка. Оно может быть решено при помощи численных методов. Однако встроенные функции решения дифференциальных уравнений, входящие в такие общеизвестные математические пакеты программ как MatCAD, MatLAB и Maple, не позволяют решать уравнения данного типа, а возможности программирования, например в MatCAD, достаточно ограничены. Первое слагаемое формулы (2) просчитывает точность опознания рукописного символа. Второе слагаемое формулы (2) просчитывает насколько данный фрагмент текста, принадлежит данному автору. Коэффициент a определяется в зависимости от качества данного рукописного текста.

Задача первого слагаемого формулы (2) заключается в расчете точности распознавания символа данного рукописного текста. Точность распознавания символа рассчитывается по формуле

prakt77.wmf,

где prakt78.wmf – интервал между текущем символом и эталонном zi класса. Т.е. среди всех классов символов, используемых при записи этих рукописных текстов, нужно найти те, интервал между которыми минимален. Для вычисления данного интервала необходимо знать коэффициенты βi и γi, которые определяются исходя из системы уравнений (3)

prakt79.wmf, (3)

где prakt80.wmf – интервал, при котором возникает первое вхождение символа не схожего с текущим, prakt81.wmf – интервал, при котором вошли все символы из этого класса, схожие с текущим. При данном значении высоты капли ее форма, в отсутствие внешнего магнитного поля, может считаться равновесной, при дальнейшем увеличении высоты капли, баланс сил действующих на каплю резко нарушается, что выражается в быстром изменении ее формы и отрыве верхней части капли.

Для дальнейших вычислений используется словарь программной системы Smalt. В базе данных, которой находится порядка ста тысяч слов.


Библиографическая ссылка

Ануприенко М.A. МОДЕЛЬ ДЕШИФРОВКИ ИСТОРИЧЕСКИХ РУКОПИСНЫХ ДОКУМЕНТОВ // Международный студенческий научный вестник. – 2016. – № 3-3. ;
URL: https://eduherald.ru/ru/article/view?id=15006 (дата обращения: 29.03.2024).

Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)

«Фундаментальные исследования» список ВАК ИФ РИНЦ = 1,674