Програмне забезпечення розпізнавання алфавітно-цифрової інформації
| dc.contributor.advisor | Семко, Володимир | |
| dc.contributor.author | Вдовиченко, Віталій Вячеславович | |
| dc.date.accessioned | 2026-03-20T09:41:39Z | |
| dc.date.issued | 2025 | |
| dc.description.abstract | Зростання обсягів візуальної інформації в ділових, технічних і адміністративних процесах, зокрема сканованих документів, фотофіксацій, відеокадрів і форм, створює запит на ефективні автоматизовані засоби перетворення зображень у структуровану текстову форму. Це особливо актуально в умовах цифрової трансформації підприємств, коли ключовим стає зменшення залежності від ручного вводу, підвищення точності даних і забезпечення сумісності з іншими інформаційними системами. Сучасні технології оптичного розпізнавання символів (OCR) часто демонструють обмежену адаптивність до реальних умов - змінної якості зображень, різноманіття шрифтів, наявності артефактів, а також специфіки української мови й форматів запису алфавітно-цифрової інформації. Водночас класичні реалізації OCR-систем рідко надають достатній рівень конфігурованості, обробки винятків або інтеграції з бізнес-логікою організацій. Це формує необхідність у розробці інтелектуального програмного забезпечення для розпізнавання символів, яке поєднує гнучку архітектуру, підтримку навчання моделей на спеціалізованих датасетах, модулі валідації результатів і можливість вбудовування в API-орієнтовані системи керування документами [1]. Метою дослідження є створення програмного забезпечення для розпізнавання алфавітно-цифрової інформації на зображеннях, яке забезпечує автоматичну локалізацію текстових областей, попередню обробку, класифікацію символів, валідацію результатів і формування структурованого вихідного представлення. Для досягнення поставленої мети необхідно виконати такі завдання: – проаналізувати сучасні методи та бібліотеки оптичного розпізнавання символів і визначити їхні обмеження; – сформулювати функціональні та технічні вимоги до програмного забезпечення; – побудувати UML-діаграми варіантів використання, активності, послідовності та компонентів; – розробити архітектуру підсистем: завантаження зображень, препроцесингу, детекції тексту, класифікації, постобробки та API-комунікації; – реалізувати програмний прототип із використанням Python, OpenCV, PyTorch і FastAPI; – провести тестування точності розпізнавання на контрольних датасетах і оцінити продуктивність рішень на різних типах вхідних зображень. Об’єктом дослідження є процеси автоматизованого вилучення текстової інформації з растрових зображень. Предметом дослідження є інформаційні моделі, алгоритми і програмні компоненти, що реалізують цикл OCR‑обробки: від зчитування зображення до виводу валідуваного тексту. Методи дослідження включають: системний аналіз, об’єктно-орієнтоване моделювання, використання нейронних мереж для розпізнавання символів, а також програмну реалізацію з використанням Python-бібліотек (OpenCV, PyTorch, Tesseract) і сервісної інфраструктури FastAPI, uvicorn, SQLite, pytest. Практична цінність полягає в можливості застосування розробленого програмного забезпечення для автоматичного оцифрування форм, документів, номерних знаків, медичних карт, бланків опитування та інших структурованих матеріалів, де присутня змішана алфавітно-цифрова інформація. Рішення легко інтегрується у веб‑сервіси, мобільні додатки та системи електронного документообігу. Наукова новизна полягає в поєднанні технологій комп’ютерного зору, сегментації й контекстної класифікації символів у цілісну архітектуру OCR-системи, здатної до адаптації під конкретні мови, формати та шаблони введення, із вбудованою можливістю аномалійної фільтрації та регламентованої валідації результатів. Апробація результатів Структура роботи відображає повний життєвий цикл розробки програмного забезпечення: у першому розділі проведено аналіз предметної області, огляд сучасних методів і постановку задачі; у другому - побудовано UML-діаграми, сформовано вимоги та спроєктовано архітектуру компонентів; третій розділ присвячено реалізації функціональних модулів, їхній інтеграції та механізмам валідації; у четвертому - представлено результати тестування, аналіз продуктивності й оцінку точності OCR-модуля. | |
| dc.identifier.citation | Вдовиченко, В.В. Програмне забезпечення розпізнавання алфавітно-цифрової інформації : дипломна робота ... магістра : 121 «Інженерія програмного забезпечення». Київ, 2025. 76 с. | |
| dc.identifier.uri | https://dglib.nubip.edu.ua/handle/123456789/14188 | |
| dc.language.iso | uk | |
| dc.publisher | НУБіП України | |
| dc.subject | програмне забезпечення | |
| dc.subject | алфавітно-цифрова інформація | |
| dc.subject | нейромережеві алгоритми | |
| dc.subject | цифрова трансформація | |
| dc.subject | software | |
| dc.subject | alphanumeric information | |
| dc.subject | neural network algorithms | |
| dc.subject | digital transformation | |
| dc.title | Програмне забезпечення розпізнавання алфавітно-цифрової інформації | |
| dc.type | Thesis | |
| thesis.degree.departament | Комп’ютерних наук | |
| thesis.degree.grantor | Факультет інформаційних технологій | |
| thesis.degree.specialty | Інженерія програмного забезпечення |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Vdovychenko_Mahisterska_Prohramne_ zabezpechennia.pdf
- Розмір:
- 1.47 MB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Вантажиться...
- Назва:
- license.txt
- Розмір:
- 1.71 KB
- Формат:
- Item-specific license agreed to upon submission
- Опис: