Програмне забезпечення інформаційної системи перетворення мовних повідомлень в текстовий формат
Вантажиться...
Дата
Автори
Назва журналу
Номер ISSN
Назва тому
Видавець
НУБіП України
Анотація
У сучасному світі інформаційні технології відіграють ключову роль у обробці та аналізі мовних даних. Перетворення аудіо- та відеоповідомлень у текстовий формат є актуальним завданням, яке знаходить застосування в багатьох сферах: від автоматизації створення субтитрів і стенограм до забезпечення доступності контенту для людей з обмеженими можливостями слуху. Особливо важливим є створення програмного забезпечення, здатного точно транскрибувати мовлення, зокрема українською мовою, яка часто є недостатньо представленою в подібних системах.
Метою даної дипломної роботи є розробка десктопного програмного забезпечення для перетворення мовних повідомлень у текстовий формат з підтримкою української та англійської мов. Запропонований застосунок забезпечує зручний інтерфейс для вибору файлів, налаштування параметрів транскрипції, перегляду та експорту результатів у текстові формати. Система працює локально, що гарантує автономність, безпеку даних і доступність для користувачів без необхідності підключення до мережі.
Актуальність роботи зумовлена зростаючою потребою в ефективних і доступних інструментах для автоматизації транскрибування мовлення. Розробка програмного забезпечення, яке поєднує сучасні методи розпізнавання мовлення та забезпечує гнучкість у виборі підходів до обробки даних, сприятиме підвищенню якості текстової інтерпретації аудіо- та відеоматеріалів.
Об’єктом дослідження є процеси перетворення мовних повідомлень у текстовий формат. Предметом дослідження виступає програмне забезпечення, яке реалізує алгоритми розпізнавання мовлення та забезпечує зручний інтерфейс для користувача.
У рамках роботи вирішуються такі завдання:
● аналіз сучасних методів і технологій розпізнавання мовлення;
● проектування архітектури десктопного програмного забезпечення;
● розробка функціоналу для транскрибування аудіо- та відеофайлів;
● створення зручного графічного інтерфейсу; тестування та оцінювання ефективності системи.
Новизна роботи полягає в розробці програмного забезпечення, яке інтегрує різні підходи до розпізнавання мовлення, забезпечуючи гнучкість вибору оптимального методу залежно від потреб користувача, а також у створенні інструменту для обробки україномовного контенту з урахуванням його лінгвістичних особливостей.
Практична цінність роботи полягає в створенні універсального програмного продукту, який може бути використаний для автоматизації транскрибування в освітніх, медійних, юридичних та інших сферах. Локальна робота застосунку забезпечує його доступність і незалежність від зовнішніх ресурсів, що робить його зручним для широкого кола користувачів.
Засобами розробки було обрано сучасні інструменти, такі як Python, openAI-Whisper, PyQT6, алгоритм DTW.
Записка складається з чотирьох розділів. Перший розділ описує аналіз предметної області, огляд існуючих рішень та формує постановку задачі. У другому розділі це проєктування системи з використанням UML діаграм та моделювання логічної моделі даних за допомогою ER діаграм.У третьому розділі описується технічні аспекти реалізації програмної системи, вибір та обгрунтування технологій, які потрібні для реалізації системи. Четвертий розділ описує вимоги до апаратних вимог, тестування та рекомендації для впровадження системи.
Опис
Ключові слова
автоматизація транскрибування мовлення, сучасні методи розпізнавання мовлення, програмне забезпечення, графічний інтерфейс, automation of speech transcription, modern speech recognition methods, software, graphical interface
Бібліографічний опис
Котик О.В. Програмне забезпечення інформаційної системи перетворення мовних повідомлень в текстовий формат : дипломна робота ... бакалавра : 121 Інженерія програмного забезпечення. Київ, 2025. 77 с.