Програмне забезпечення розпізнавання алфавітно-цифрової інформації

dc.contributor.advisorСемко, Володимир
dc.contributor.authorВдовиченко, Віталій Вячеславович
dc.date.accessioned2026-03-20T09:41:39Z
dc.date.issued2025
dc.description.abstractЗростання обсягів візуальної інформації в ділових, технічних і адміністративних процесах, зокрема сканованих документів, фотофіксацій, відеокадрів і форм, створює запит на ефективні автоматизовані засоби перетворення зображень у структуровану текстову форму. Це особливо актуально в умовах цифрової трансформації підприємств, коли ключовим стає зменшення залежності від ручного вводу, підвищення точності даних і забезпечення сумісності з іншими інформаційними системами. Сучасні технології оптичного розпізнавання символів (OCR) часто демонструють обмежену адаптивність до реальних умов - змінної якості зображень, різноманіття шрифтів, наявності артефактів, а також специфіки української мови й форматів запису алфавітно-цифрової інформації. Водночас класичні реалізації OCR-систем рідко надають достатній рівень конфігурованості, обробки винятків або інтеграції з бізнес-логікою організацій. Це формує необхідність у розробці інтелектуального програмного забезпечення для розпізнавання символів, яке поєднує гнучку архітектуру, підтримку навчання моделей на спеціалізованих датасетах, модулі валідації результатів і можливість вбудовування в API-орієнтовані системи керування документами [1]. Метою дослідження є створення програмного забезпечення для розпізнавання алфавітно-цифрової інформації на зображеннях, яке забезпечує автоматичну локалізацію текстових областей, попередню обробку, класифікацію символів, валідацію результатів і формування структурованого вихідного представлення. Для досягнення поставленої мети необхідно виконати такі завдання: – проаналізувати сучасні методи та бібліотеки оптичного розпізнавання символів і визначити їхні обмеження; – сформулювати функціональні та технічні вимоги до програмного забезпечення; – побудувати UML-діаграми варіантів використання, активності, послідовності та компонентів; – розробити архітектуру підсистем: завантаження зображень, препроцесингу, детекції тексту, класифікації, постобробки та API-комунікації; – реалізувати програмний прототип із використанням Python, OpenCV, PyTorch і FastAPI; – провести тестування точності розпізнавання на контрольних датасетах і оцінити продуктивність рішень на різних типах вхідних зображень. Об’єктом дослідження є процеси автоматизованого вилучення текстової інформації з растрових зображень. Предметом дослідження є інформаційні моделі, алгоритми і програмні компоненти, що реалізують цикл OCR‑обробки: від зчитування зображення до виводу валідуваного тексту. Методи дослідження включають: системний аналіз, об’єктно-орієнтоване моделювання, використання нейронних мереж для розпізнавання символів, а також програмну реалізацію з використанням Python-бібліотек (OpenCV, PyTorch, Tesseract) і сервісної інфраструктури FastAPI, uvicorn, SQLite, pytest. Практична цінність полягає в можливості застосування розробленого програмного забезпечення для автоматичного оцифрування форм, документів, номерних знаків, медичних карт, бланків опитування та інших структурованих матеріалів, де присутня змішана алфавітно-цифрова інформація. Рішення легко інтегрується у веб‑сервіси, мобільні додатки та системи електронного документообігу. Наукова новизна полягає в поєднанні технологій комп’ютерного зору, сегментації й контекстної класифікації символів у цілісну архітектуру OCR-системи, здатної до адаптації під конкретні мови, формати та шаблони введення, із вбудованою можливістю аномалійної фільтрації та регламентованої валідації результатів. Апробація результатів Структура роботи відображає повний життєвий цикл розробки програмного забезпечення: у першому розділі проведено аналіз предметної області, огляд сучасних методів і постановку задачі; у другому - побудовано UML-діаграми, сформовано вимоги та спроєктовано архітектуру компонентів; третій розділ присвячено реалізації функціональних модулів, їхній інтеграції та механізмам валідації; у четвертому - представлено результати тестування, аналіз продуктивності й оцінку точності OCR-модуля.
dc.identifier.citationВдовиченко, В.В. Програмне забезпечення розпізнавання алфавітно-цифрової інформації : дипломна робота ... магістра : 121 «Інженерія програмного забезпечення». Київ, 2025. 76 с.
dc.identifier.urihttps://dglib.nubip.edu.ua/handle/123456789/14188
dc.language.isouk
dc.publisherНУБіП України
dc.subjectпрограмне забезпечення
dc.subjectалфавітно-цифрова інформація
dc.subjectнейромережеві алгоритми
dc.subjectцифрова трансформація
dc.subjectsoftware
dc.subjectalphanumeric information
dc.subjectneural network algorithms
dc.subjectdigital transformation
dc.titleПрограмне забезпечення розпізнавання алфавітно-цифрової інформації
dc.typeThesis
thesis.degree.departamentКомп’ютерних наук
thesis.degree.grantorФакультет інформаційних технологій
thesis.degree.specialtyІнженерія програмного забезпечення

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Vdovychenko_Mahisterska_Prohramne_ zabezpechennia.pdf
Розмір:
1.47 MB
Формат:
Adobe Portable Document Format

Ліцензійна угода

Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
license.txt
Розмір:
1.71 KB
Формат:
Item-specific license agreed to upon submission
Опис: