Система обробки та зберігання даних закордонних паспортів з елементами машинного навчання

Вантажиться...
Ескіз

Дата

Назва журналу

Номер ISSN

Назва тому

Видавець

Анотація

Сучасні туристичні компанії використовують цифрові технології для автоматизації процесів обслуговування клієнтів. Одним із основних документів, необхідних для здійснення подорожей, є закордонний паспорт, дані якого необхідно швидко та безпомилково вводити у системи бронювання авіаквитків, готелів та інших послуг. У більшості туристичних агентств дані з паспортів вводяться вручну — менеджери переносять інформацію зі сканів або фото у систему бронювання. Такий підхід займає багато часу і часто призводить до неточностей: навіть одна помилка в номері або прізвищі може спричинити відмову у посадці на рейс чи потребу повторного бронювання. У цій роботі розглядається можливість використання технологій оптичного розпізнавання символів (OCR) разом із алгоритмами машинного навчання для автоматизації зчитування паспортних даних. Отже, створення системи обробки та зберігання даних закордонних паспортів з елементами машинного навчання є актуальним завданням для туристичних фірм, оскільки воно повинно забезпечити швидкість, точність і надійність роботи з документами, що напряму впливає на якість послуг і конкурентоспроможність компанії. Об’єктом дослідження процеси автоматичної обробки паспортних даних в інформаційних системах туристичних компаній. Об’єктом виступають цифрові зображення закордонних паспортів, що містять персональні дані клієнтів, а також технологічні етапи їх розпізнавання, верифікації та подальшого збереження у корпоративних базах даних. Особливу увагу приділено аспектам підвищення точності та швидкості обробки цих даних, що має безпосередній вплив на якість сервісного обслуговування та ефективність бізнес-процесів у сфері туризму. Предметом дослідження є система автоматизації обробки даних закордонних паспортів із використанням елементів машинного навчання. Предмет охоплює методи, моделі та алгоритми, які забезпечують інтелектуальну обробку зображень паспортів, включно з виділенням зон MRZ, підвищенням якості зображення, оптичним розпізнаванням символів (OCR) та автоматичною корекцією помилок за допомогою глибоких нейронних мереж. Основна увага приділяється побудові комплексної системи, здатної працювати в реальному часі та інтегруватися в існуючі інформаційні системи туристичних компаній. Метою дослідження даної роботи є оцінка впливу методів машинного навчання на ефективність розпізнавання паспортних даних за допомогою технології OCR та розробити програмну систему, що забезпечує автоматизацію процесу обробки паспортної інформації. Досягнення поставленої мети передбачає аналіз сучасних технологій оптичного розпізнавання символів, вивчення можливостей глибоких нейронних мереж для підвищення точності та надійності обробки даних, а також практичну реалізацію системи, здатної зменшити вплив людського фактора, скоротити час введення інформації та забезпечити єдину стандартизовану структуру паспортних даних. Для досягнення мети дослідження у магістерській роботі поставлено наступні завдання: 1. Провести аналіз процесів обробки та зберігання даних закордонних паспортів у туристичних компаніях. 2. Сформулювати функціональні та нефункціональні вимоги до системи автоматизації обробки паспортних даних. 3. Дослідити сучасні технології оптичного розпізнавання символів (OCR) та алгоритми машинного навчання, які можуть бути застосовані для автоматизації обробки паспортних даних. 4. Побудувати модель предметної області та архітектуру системи обробки та зберігання даних закордонних паспортів. 5. Розробити програмну реалізацію системи та інтегрувати методи OCR і машинного навчання для підвищення точності і швидкості обробки даних. 6. Провести тестування системи, оцінити її ефективність та сформулювати висновки щодо доцільності використання запропонованого рішення. Для досягнення мети магістерської роботи та виконання поставлених завдань використовуються комплексні методи дослідження, що поєднують аналіз процесів, сучасні інформаційні технології та алгоритми машинного навчання. На першому етапі проводиться системний аналіз об’єкта дослідження — процесів обробки та зберігання даних закордонних паспортів у туристичних компаніях. Це дозволяє виявити проблемні місця, оцінити ефективність існуючих підходів та сформулювати вимоги до автоматизованої системи. Для автоматизації зчитування паспортних даних застосовується технологія оптичного розпізнавання символів (OCR), що забезпечує високоточне отримання інформації з документів, мінімізуючи людські помилки при введенні даних у системи бронювання. Для підвищення точності і надійності обробки даних використовується машинне навчання, зокрема алгоритми для перевірки коректності зчитаних даних, виявлення аномалій та автоматичного виправлення помилок. Застосування таких методів дозволяє не лише прискорити процес обробки паспортів, але й забезпечити більшу надійність і безпеку збереження інформації. Таким чином, комплексний підхід, що поєднує системний аналіз, OCR, алгоритми машинного навчання та організацію баз даних, забезпечує реалізацію поставленої мети дослідження та підвищує ефективність процесів обробки паспортних даних у туристичній компанії. Наукова новизна магістерської роботи полягає у використанні методів машинного навчання для підвищення ефективності технології OCR під час автоматизованого зчитування паспортних даних. Розроблено та реалізовано підхід до попередньої обробки зображень закордонних паспортів, який дозволяє покращити якість розпізнавання MRZ-зони, особливо у випадках низької якості зображення чи спотворень. Удосконалено процес перевірки та корекції результатів розпізнавання шляхом використання моделі машинного навчання для автоматичного виявлення помилкових символів і їх виправлення за допомогою статистичних закономірностей у структурі MRZ-коду. Розроблена архітектура системи забезпечує інтеграцію OCR та ML-модулів із реляційною базою даних, що підвищує швидкість доступу до інформації та зменшує ймовірність втрати або дублювання даних. Отримані результати становлять практичну та наукову цінність, оскільки доводять доцільність поєднання технологій оптичного розпізнавання символів із методами машинного навчання для оптимізації процесів обробки паспортних документів у сфері туристичних послуг. Магістерська робота викладена на 82 сторінках машинописного тексту, містить 18 рисунків, 3 таблиць та список використаних джерел із 32 найменувань. Робота складається зі вступу, чотирьох розділів, висновків, списку використаних джерел і додатків. У вступі обґрунтовано актуальність теми, визначено мету, об’єкт, предмет і завдання дослідження, наведено наукову новизну та практичне значення отриманих результатів. У першому розділі проведено системний аналіз предметної області, подано опис паспортних документів, виконано огляд існуючих підходів до автоматизації обробки паспортних даних, розглянуто сучасні технології OCR та методи машинного навчання, а також сформульовано постановку завдання магістерського дослідження. У другому розділі здійснено моделювання системи: обґрунтовано методологію моделювання, побудовано об’єктні та функціональні діаграми (прецедентів, послідовності, діяльності), спроєктовано структуру бази даних і визначено вимоги до системи. У третьому розділі описано процес розробки системи. Наведено вибір інструментальних засобів і середовища розробки, розглянуто використання технологій Tesseract OCR, ML.NET і SQL Server. Подано архітектуру системи, описано реалізацію модулів для обробки зображень паспортів та користувацького інтерфейсу. У четвертому розділі наведено результати дослідження: визначено вимоги до апаратного та програмного забезпечення, описано хід виконання дослідження, проведено оцінку ефективності роботи системи та порівняльний аналіз результатів. У висновках узагальнено результати дослідження, сформульовано основні наукові та практичні висновки, а також наведено рекомендації щодо подальшого розвитку системи.

Опис

Ключові слова

цифрові технології, технологій оптичного розпізнавання символів, автоматизації зчитування паспортних даних, технології OCR, digital technologies, optical character recognition technologies, automation of passport data reading, OCR technology

Бібліографічний опис

Прокопенко Д. О. Система обробки та зберігання даних закордонних паспортів з елементами машинного навчання : кваліфікаційна робота … магістра : 122 Комп’ютерні науки. Київ, 2025. 82 с.

Endorsement

Review

Supplemented By

Referenced By