Програмне забезпечення розпізнавання алфавітно-цифрової інформації

Вантажиться...
Ескіз

Дата

Назва журналу

Номер ISSN

Назва тому

Видавець

НУБіП України

Анотація

Зростання обсягів візуальної інформації в ділових, технічних і адміністративних процесах, зокрема сканованих документів, фотофіксацій, відеокадрів і форм, створює запит на ефективні автоматизовані засоби перетворення зображень у структуровану текстову форму. Це особливо актуально в умовах цифрової трансформації підприємств, коли ключовим стає зменшення залежності від ручного вводу, підвищення точності даних і забезпечення сумісності з іншими інформаційними системами. Сучасні технології оптичного розпізнавання символів (OCR) часто демонструють обмежену адаптивність до реальних умов - змінної якості зображень, різноманіття шрифтів, наявності артефактів, а також специфіки української мови й форматів запису алфавітно-цифрової інформації. Водночас класичні реалізації OCR-систем рідко надають достатній рівень конфігурованості, обробки винятків або інтеграції з бізнес-логікою організацій. Це формує необхідність у розробці інтелектуального програмного забезпечення для розпізнавання символів, яке поєднує гнучку архітектуру, підтримку навчання моделей на спеціалізованих датасетах, модулі валідації результатів і можливість вбудовування в API-орієнтовані системи керування документами [1]. Метою дослідження є створення програмного забезпечення для розпізнавання алфавітно-цифрової інформації на зображеннях, яке забезпечує автоматичну локалізацію текстових областей, попередню обробку, класифікацію символів, валідацію результатів і формування структурованого вихідного представлення. Для досягнення поставленої мети необхідно виконати такі завдання: – проаналізувати сучасні методи та бібліотеки оптичного розпізнавання символів і визначити їхні обмеження; – сформулювати функціональні та технічні вимоги до програмного забезпечення; – побудувати UML-діаграми варіантів використання, активності, послідовності та компонентів; – розробити архітектуру підсистем: завантаження зображень, препроцесингу, детекції тексту, класифікації, постобробки та API-комунікації; – реалізувати програмний прототип із використанням Python, OpenCV, PyTorch і FastAPI; – провести тестування точності розпізнавання на контрольних датасетах і оцінити продуктивність рішень на різних типах вхідних зображень. Об’єктом дослідження є процеси автоматизованого вилучення текстової інформації з растрових зображень. Предметом дослідження є інформаційні моделі, алгоритми і програмні компоненти, що реалізують цикл OCR‑обробки: від зчитування зображення до виводу валідуваного тексту. Методи дослідження включають: системний аналіз, об’єктно-орієнтоване моделювання, використання нейронних мереж для розпізнавання символів, а також програмну реалізацію з використанням Python-бібліотек (OpenCV, PyTorch, Tesseract) і сервісної інфраструктури FastAPI, uvicorn, SQLite, pytest. Практична цінність полягає в можливості застосування розробленого програмного забезпечення для автоматичного оцифрування форм, документів, номерних знаків, медичних карт, бланків опитування та інших структурованих матеріалів, де присутня змішана алфавітно-цифрова інформація. Рішення легко інтегрується у веб‑сервіси, мобільні додатки та системи електронного документообігу. Наукова новизна полягає в поєднанні технологій комп’ютерного зору, сегментації й контекстної класифікації символів у цілісну архітектуру OCR-системи, здатної до адаптації під конкретні мови, формати та шаблони введення, із вбудованою можливістю аномалійної фільтрації та регламентованої валідації результатів. Апробація результатів Структура роботи відображає повний життєвий цикл розробки програмного забезпечення: у першому розділі проведено аналіз предметної області, огляд сучасних методів і постановку задачі; у другому - побудовано UML-діаграми, сформовано вимоги та спроєктовано архітектуру компонентів; третій розділ присвячено реалізації функціональних модулів, їхній інтеграції та механізмам валідації; у четвертому - представлено результати тестування, аналіз продуктивності й оцінку точності OCR-модуля.

Опис

Ключові слова

програмне забезпечення, алфавітно-цифрова інформація, нейромережеві алгоритми, цифрова трансформація, software, alphanumeric information, neural network algorithms, digital transformation

Бібліографічний опис

Вдовиченко, В.В. Програмне забезпечення розпізнавання алфавітно-цифрової інформації : дипломна робота ... магістра : 121 «Інженерія програмного забезпечення». Київ, 2025. 76 с.

Endorsement

Review

Supplemented By

Referenced By