Програмне забезпечення розпізнавання алфавітно-цифрової інформації

Вдовиченко, Віталій Вячеславович

Програмне забезпечення розпізнавання алфавітно-цифрової інформації

dc.contributor.advisor	Семко, Володимир
dc.contributor.author	Вдовиченко, Віталій Вячеславович
dc.date.accessioned	2026-03-20T09:41:39Z
dc.date.issued	2025
dc.description.abstract	Зростання обсягів візуальної інформації в ділових, технічних і адміністративних процесах, зокрема сканованих документів, фотофіксацій, відеокадрів і форм, створює запит на ефективні автоматизовані засоби перетворення зображень у структуровану текстову форму. Це особливо актуально в умовах цифрової трансформації підприємств, коли ключовим стає зменшення залежності від ручного вводу, підвищення точності даних і забезпечення сумісності з іншими інформаційними системами. Сучасні технології оптичного розпізнавання символів (OCR) часто демонструють обмежену адаптивність до реальних умов - змінної якості зображень, різноманіття шрифтів, наявності артефактів, а також специфіки української мови й форматів запису алфавітно-цифрової інформації. Водночас класичні реалізації OCR-систем рідко надають достатній рівень конфігурованості, обробки винятків або інтеграції з бізнес-логікою організацій. Це формує необхідність у розробці інтелектуального програмного забезпечення для розпізнавання символів, яке поєднує гнучку архітектуру, підтримку навчання моделей на спеціалізованих датасетах, модулі валідації результатів і можливість вбудовування в API-орієнтовані системи керування документами [1]. Метою дослідження є створення програмного забезпечення для розпізнавання алфавітно-цифрової інформації на зображеннях, яке забезпечує автоматичну локалізацію текстових областей, попередню обробку, класифікацію символів, валідацію результатів і формування структурованого вихідного представлення. Для досягнення поставленої мети необхідно виконати такі завдання: – проаналізувати сучасні методи та бібліотеки оптичного розпізнавання символів і визначити їхні обмеження; – сформулювати функціональні та технічні вимоги до програмного забезпечення; – побудувати UML-діаграми варіантів використання, активності, послідовності та компонентів; – розробити архітектуру підсистем: завантаження зображень, препроцесингу, детекції тексту, класифікації, постобробки та API-комунікації; – реалізувати програмний прототип із використанням Python, OpenCV, PyTorch і FastAPI; – провести тестування точності розпізнавання на контрольних датасетах і оцінити продуктивність рішень на різних типах вхідних зображень. Об’єктом дослідження є процеси автоматизованого вилучення текстової інформації з растрових зображень. Предметом дослідження є інформаційні моделі, алгоритми і програмні компоненти, що реалізують цикл OCR‑обробки: від зчитування зображення до виводу валідуваного тексту. Методи дослідження включають: системний аналіз, об’єктно-орієнтоване моделювання, використання нейронних мереж для розпізнавання символів, а також програмну реалізацію з використанням Python-бібліотек (OpenCV, PyTorch, Tesseract) і сервісної інфраструктури FastAPI, uvicorn, SQLite, pytest. Практична цінність полягає в можливості застосування розробленого програмного забезпечення для автоматичного оцифрування форм, документів, номерних знаків, медичних карт, бланків опитування та інших структурованих матеріалів, де присутня змішана алфавітно-цифрова інформація. Рішення легко інтегрується у веб‑сервіси, мобільні додатки та системи електронного документообігу. Наукова новизна полягає в поєднанні технологій комп’ютерного зору, сегментації й контекстної класифікації символів у цілісну архітектуру OCR-системи, здатної до адаптації під конкретні мови, формати та шаблони введення, із вбудованою можливістю аномалійної фільтрації та регламентованої валідації результатів. Апробація результатів Структура роботи відображає повний життєвий цикл розробки програмного забезпечення: у першому розділі проведено аналіз предметної області, огляд сучасних методів і постановку задачі; у другому - побудовано UML-діаграми, сформовано вимоги та спроєктовано архітектуру компонентів; третій розділ присвячено реалізації функціональних модулів, їхній інтеграції та механізмам валідації; у четвертому - представлено результати тестування, аналіз продуктивності й оцінку точності OCR-модуля.
dc.identifier.citation	Вдовиченко, В.В. Програмне забезпечення розпізнавання алфавітно-цифрової інформації : дипломна робота ... магістра : 121 «Інженерія програмного забезпечення». Київ, 2025. 76 с.
dc.identifier.uri	https://dglib.nubip.edu.ua/handle/123456789/14188
dc.language.iso	uk
dc.publisher	НУБіП України
dc.subject	програмне забезпечення
dc.subject	алфавітно-цифрова інформація
dc.subject	нейромережеві алгоритми
dc.subject	цифрова трансформація
dc.subject	software
dc.subject	alphanumeric information
dc.subject	neural network algorithms
dc.subject	digital transformation
dc.title	Програмне забезпечення розпізнавання алфавітно-цифрової інформації
dc.type	Thesis
thesis.degree.departament	Комп’ютерних наук
thesis.degree.grantor	Факультет інформаційних технологій
thesis.degree.specialty	Інженерія програмного забезпечення

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1

Назва:: Vdovychenko_Mahisterska_Prohramne_ zabezpechennia.pdf
Розмір:: 1.47 MB
Формат:: Adobe Portable Document Format

Завантажити

Ліцензійна угода

Зараз показуємо 1 - 1 з 1

Назва:: license.txt
Розмір:: 1.71 KB
Формат:: Item-specific license agreed to upon submission
Опис:

Завантажити

Зібрання

ОПП "Програмне забезпечення інформаційних систем"