Програмне забезпечення розпізнавання алфавітно-цифрової інформації
Вантажиться...
Дата
Назва журналу
Номер ISSN
Назва тому
Видавець
НУБіП України
Анотація
Зростання обсягів візуальної інформації в ділових, технічних і адміністративних процесах, зокрема сканованих документів, фотофіксацій, відеокадрів і форм, створює запит на ефективні автоматизовані засоби перетворення зображень у структуровану текстову форму.
Це особливо актуально в умовах цифрової трансформації підприємств, коли ключовим стає зменшення залежності від ручного вводу, підвищення точності даних і забезпечення сумісності з іншими інформаційними системами. Сучасні технології оптичного розпізнавання символів (OCR) часто демонструють обмежену адаптивність до реальних умов - змінної якості зображень, різноманіття шрифтів, наявності артефактів, а також специфіки української мови й форматів запису алфавітно-цифрової інформації. Водночас класичні реалізації OCR-систем рідко надають достатній рівень конфігурованості, обробки винятків або інтеграції з бізнес-логікою організацій. Це формує необхідність у розробці інтелектуального програмного забезпечення для розпізнавання символів, яке поєднує гнучку архітектуру, підтримку навчання моделей на спеціалізованих датасетах, модулі валідації результатів і можливість вбудовування в API-орієнтовані системи керування документами [1].
Метою дослідження є створення програмного забезпечення для розпізнавання алфавітно-цифрової інформації на зображеннях, яке забезпечує автоматичну локалізацію текстових областей, попередню обробку, класифікацію символів, валідацію результатів і формування структурованого вихідного представлення.
Для досягнення поставленої мети необхідно виконати такі завдання:
– проаналізувати сучасні методи та бібліотеки оптичного розпізнавання символів і визначити їхні обмеження;
– сформулювати функціональні та технічні вимоги до програмного забезпечення;
– побудувати UML-діаграми варіантів використання, активності, послідовності та компонентів;
– розробити архітектуру підсистем: завантаження зображень, препроцесингу, детекції тексту, класифікації, постобробки та API-комунікації;
– реалізувати програмний прототип із використанням Python, OpenCV, PyTorch і FastAPI;
– провести тестування точності розпізнавання на контрольних датасетах і оцінити продуктивність рішень на різних типах вхідних зображень.
Об’єктом дослідження є процеси автоматизованого вилучення текстової інформації з растрових зображень.
Предметом дослідження є інформаційні моделі, алгоритми і програмні компоненти, що реалізують цикл OCR‑обробки: від зчитування зображення до виводу валідуваного тексту.
Методи дослідження включають: системний аналіз, об’єктно-орієнтоване моделювання, використання нейронних мереж для розпізнавання символів, а також програмну реалізацію з використанням Python-бібліотек (OpenCV, PyTorch, Tesseract) і сервісної інфраструктури FastAPI, uvicorn, SQLite, pytest.
Практична цінність полягає в можливості застосування розробленого програмного забезпечення для автоматичного оцифрування форм, документів, номерних знаків, медичних карт, бланків опитування та інших структурованих матеріалів, де присутня змішана алфавітно-цифрова інформація. Рішення легко інтегрується у веб‑сервіси, мобільні додатки та системи електронного документообігу.
Наукова новизна полягає в поєднанні технологій комп’ютерного зору, сегментації й контекстної класифікації символів у цілісну архітектуру OCR-системи, здатної до адаптації під конкретні мови, формати та шаблони
введення, із вбудованою можливістю аномалійної фільтрації та регламентованої валідації результатів. Апробація результатів Структура роботи відображає повний життєвий цикл розробки програмного забезпечення:
у першому розділі проведено аналіз предметної області, огляд сучасних методів і постановку задачі;
у другому - побудовано UML-діаграми, сформовано вимоги та спроєктовано архітектуру компонентів;
третій розділ присвячено реалізації функціональних модулів, їхній інтеграції та механізмам валідації;
у четвертому - представлено результати тестування, аналіз продуктивності й оцінку точності OCR-модуля.
Опис
Ключові слова
програмне забезпечення, алфавітно-цифрова інформація, нейромережеві алгоритми, цифрова трансформація, software, alphanumeric information, neural network algorithms, digital transformation
Бібліографічний опис
Вдовиченко, В.В. Програмне забезпечення розпізнавання алфавітно-цифрової інформації : дипломна робота ... магістра : 121 «Інженерія програмного забезпечення». Київ, 2025. 76 с.