Математична модель і програмна імплементація біометричної системи автоматичного розпізнавання голосу
Вантажиться...
Дата
Автори
ORCID
DOI
Науковий ступінь
Рівень дисертації
Шифр та назва спеціальності
Рада захисту
Установа захисту
Науковий керівник/консультант
Члени комітету
Назва журналу
Номер ISSN
Назва тому
Видавець
Харків : Харківський національний університет імені В. Н. Каразіна
Анотація
В ході роботи були проаналізовані основні види систем розпізнавання, методи зменшення рівня шуму, алгоритм детектування активного мовлення, мел частотні кепстральні коефіцієнти та модель суміші Гауса. Розроблена математична модель та програмна імплементація біометричної системи автоматичного розпізнавання по голосу за допомогою мови програмування Python. За допомогою сервісу Descript було згенеровано мовлення на основі попередньо записаного аудіофрагменту та перевірено роботу алгоритму за умови використання підробки. Проведено аналіз результатів та наведено рекомендації щодо значень параметрів системи, які дозволять отримати найвищі можливі показники ефективності. Результати роботи можуть використовуватись у розробці майбутніх систем автоматичного розпізнавання по голосу або бути частиною складних систем. Для покращення ефективності розробленої системи запропоновано використання додаткового випадкового паролю та часового ліміту. В майбутніх дослідженнях з цієї теми потрібно передбачити використання більшої кількості учасників для розуміння універсальності системи.
In the course of the work, the main types of recognition systems, noise reduction methods, voice active detection algorithm, mel-frequency cepstral coefficients and Gaussian mixture models were analyzed. A mathematical model and program implementation of a biometric system of automatic voice recognition was developed using Python programming language. With the help of the Descript service, the speech was generated based on a pre-recorded audio fragment, and the algorithm was tested using a fake. The results are analyzed, and recommendations are given on the values of the system parameters that will allow for obtaining the highest possible performance indicators. The work results can be used in developing future automatic voice recognition systems or be part of complex systems. To improve the efficiency of the developed system, it is proposed to use an additional random password and time limit. Future research on this topic should include the use of a more significant number of participants to understand the system's universality.
In the course of the work, the main types of recognition systems, noise reduction methods, voice active detection algorithm, mel-frequency cepstral coefficients and Gaussian mixture models were analyzed. A mathematical model and program implementation of a biometric system of automatic voice recognition was developed using Python programming language. With the help of the Descript service, the speech was generated based on a pre-recorded audio fragment, and the algorithm was tested using a fake. The results are analyzed, and recommendations are given on the values of the system parameters that will allow for obtaining the highest possible performance indicators. The work results can be used in developing future automatic voice recognition systems or be part of complex systems. To improve the efficiency of the developed system, it is proposed to use an additional random password and time limit. Future research on this topic should include the use of a more significant number of participants to understand the system's universality.
Опис
Керівник роботи: Рассомахін Сергій Геннадійович, доктор технічних наук, професор кафедри безпеки інформаційних систем, мереж і технологій Навчально-наукового інституту комп’ютерних наук та штучного інтелекту
Ключові слова
TECHNOLOGY::Information technology, біометрія, спектр, автентифікація, ідентифікація, мел-частотні кепстральні коефіцієнти, кепстр, автоматичне розпізнавання, модель суміші Гауса, biometrics, authentication, identification, mel-frequency cepstral coefficients, spectrum, cepstrum, automatic recognition, Gaussian mixture model
Бібліографічний опис
Дегтяр, Ірина Олександрівна. Математична модель і програмна імплементація біометричної системи автоматичного розпізнавання голосу : пояснювальна записка до кваліфікаційної роботи магістра : спеціальність 125 – Кібербезпека : освітня програма «Безпека інформаційних і комунікаційних систем» / І. О. Дегтяр ; кер. роботи С. Г. Рассомахін. – Харків : Харківський національний університет імені В. Н. Каразіна, 2022. – 73 с.
