Українська
Українська
English
Анотації DOI: 10.30837/pt.2019.2.07

Куценко Єгор Євгенович, Пастушенко Микола Савелійович

Оцінка частоти основного тону голосового сигналу користувача системи автентифікації

У статті аналізуються і досліджуються напрямки підвищення якісних характеристик систем голосової автентифікації в різних системах доступу. Один з основних напрямків підвищення якісних характеристик цих систем автентифікації користувача пов’язаний з використанням фазової інформації голосового сигналу. Об’єктом дослідження є процес цифрової обробки сигналів у системах голосової автентифікації. Вирішується актуальне наукове завдання дослідження нових процедур для уточнення оцінок частоти основного тону, отриманих на основі аналізу амплітудно-частотного спектра. Уточнення оцінок проводилося на основі використання фазових даних голосового сигналу, а також оцінки частоти основного тону в процесі отримання кепстральних коефіцієнтів. Мета даної роботи — дослідження впливу фазових даних на точність оцінки частоти основного тону в процесі формування шаблону користувача. Дані отримані в процесі статистичного аналізу результатів моделювання з використанням модельних і експериментальних голосових даних користувача системи автентифікації. Фазові дані голосового сигналу дозволяють отримувати адекватні та достовірні оцінки в процесі спектрального аналізу. Однак при наявності помилок, пов’язаних з грубими помилками, наприклад, прийняття за оцінку частоти основного тону частот першої або другої формант, перевагу слід віддавати оцінці, отриманій у процесі розрахунку кепстральних коефіцієнтів. Досліджено вплив довжини семплів і їх перекриття в процесі розрахунку кепстральних коефіцієнтів. Представлені результати досліджень доцільно використовувати в системах голосової автентифікації, вдосконаленні систем розпізнавання мови, а також при вирішенні завдань ідентифікації диктора.

Ключові слова: частота, автентифікація, сигнал, голос, фаза, тон

Yehor Kutsenko, Mykola Pastushenko

The voice tone frequency estimate of the user authentication system

The directions for improving the quality characteristics of voice authentication systems in different access systems are analyzed and investigated in the article. One of the main areas of enhancing the quality characteristics of these user authentication systems is related to the use of phase information of the voice signal. The object of the study is the process of digital signal processing in voice authentication systems. The relevant scientific task of investigating new procedures to refine estimates of pitch frequency obtained on the basis of the analysis of the amplitude-frequency spectrum is solved. The estimates were refined based on the use of phase data of a voice signal, as well as the estimation of the pitch frequency in the process of obtaining kepstral coefficients. The purpose of this work is to investigate the effect of phase data on the accuracy of estimating the pitch frequency in the process of forming a user pattern. The results have been obtained in the process of statistical analysis of the simulation results using model and experimental voice data of the user authentication system. The phase data of the voice signal allow to obtain adequate and reliable estimates in the process of spectral analysis. However, in the presence of errors associated with gross errors, such as the acceptance of the pitch of the frequencies of the first or second formants, preference should be given to the estimate obtained in the process of calculating kepstral coefficients. The influence of sample length and their overlap in the process of calculating kepstral coefficients is investigated. The presented research results should be used in voice authentication systems, improvement of speech recognition systems, as well as in solving problems of speaker identification.

Keywords: frequency, authentication, signal, voice, phase, tone

Стаття
DOI