Українська
Українська
English
Анотації DOI: 10.30837/pt.2025.1.04

Пастушенко Микола Савелійович, Пастушенко Олександр Миколайович, Файзулаєв Тимур Алійович, Штангей Світлана Вікторівна

Вплив процедур обробки голосового сигналу системи автентифікації на якість формантних даних

Розглядається актуальне наукове завдання щодо підвищення ефективності голосових систем автентифікації, які широко використовуються в сучасних системах доступу. Відомо, що знизити помилки першого і другого роду в голосових системах автентифікації можна шляхом удосконалення процедур цифрової обробки голосового сигналу, що аналізується, за рахунок більш якісного вилучення ознак користувача або удосконалення процедур прийняття рішення про допуск користувача. Важливе місце у всіх процедурах обробки голосових сигналів займають формантні дані (рівень спектральної потужності, формантні частоти, огинаюча спектру та ширина спектру формантних частот). На основі двох перших формант вирішуються завдання розпізнавання та синтезу мови, а дві наступні форманти дозволяють вирішити проблему автентифікації користувача. Мета даної роботи – намітити шляхи підвищення якості формування формантних даних стосовно задач цифрової обробки мовних сигналів. Об’єктом дослідження є процес отримання формантних даних при використанні амплітудно-частотної та фазової інформації, а також результатів розрахунку автокореляційної функції аналізованого сигналу. Предмет дослідження – методи та процедури вилучення формантних даних у процесі експериментальних досліджень. Наукова новизна отриманих результатів дослідження полягає в тому, що вперше виконано порівняльний аналіз формантних даних, отриманих за різною вихідною інформацією, а саме амплітудно-частотною та фазовою інформацією, а також результатів розрахунку автокореляційної функції аналізованого сигналу. Достовірність результатів досліджень обґрунтована коректним використанням відомого математичного апарату та збігом оцінок формантних даних в результаті обробки експериментального сигналу користувача. Практична значущість полягає в тому, що отримані результати дозволяють підвищити якість та ефективність обробки голосових даних при розпізнаванні та синтезі мови, автентифікації користувача в голосових системах та низці інших прикладних завдань, пов’язаних із мовотворенням.

Ключові слова: автокореляція, автентифікація, голосовий сигнал, спектр, фаза, форманта

Pastushenko Mykola, Pastushenko Oleksandr, Faizulaiev Tymur, Shtanhei Svitlana

Influence of procedures for processing the voice signal of authentication system on the quality of formant data

The current scientific task of improving the efficiency of voice authentication systems, which are widely used in modern access systems, is considered. It is known that it is possible to reduce errors of the first and second kinds in voice authentication systems by improving the procedures for the digital processing of the voice signal being analyzed, by better extraction of user features, or by improving procedures for decision-making on user admission. An important place in all voice signal processing procedures is occupied by formant data (spectral power levels, formant frequencies, spectral envelopes, and the width of the formant frequency spectrum). Based on the first two formants, speech recognition and synthesis are solved, and the next two formants enable user authentication. The purpose of this work is to outline ways to improve the quality of the formation of formant data in relation to the tasks of digital processing of speech signals. The object of the study is the process of obtaining formant data using amplitude-frequency and phase information, as well as the results of calculating the autocorrelation function of the analyzed signal. The subject of the study is methods and procedures for extracting formant data in the context of experimental research. The scientific novelty of the obtained research results lies in the fact that, for the first time, a comparative analysis of formant data obtained from different source information, namely amplitude-frequency and phase information, as well as the results of calculating the autocorrelation function of the analyzed signal, has been performed. The reliability of the research results is justified by the proper use of the known mathematical apparatus and the coincidence of formant data estimates as a result of processing the experimental user signal. The practical significance lies in the fact that the obtained results enable improvements in the quality and efficiency of voice data processing for speech recognition and synthesis, user authentication in voice systems, and several other applied tasks related to speech production.

Keywords: autocorrelation, authentication, voice signal, spectrum, phase, formant

Стаття
DOI