Ақпараттық-коммуникациялық және химиялық технология

№ 1 (26) - 2025 / 2025-03-31 - 2025-03-31 жаңартылды / Көрілім саны: 47

КЛАССИФИКАЦИЯЛЫҚ АЛГОРИТМДЕРДІ ҚОЛДАНЫП ДАУЫСТЫ ТАНУ

Авторлар

Қазақ ұлттық қыздар педагогикалық университеті
https://orcid.org/0000-0002-9117-4369
Әл-Фараби атындағы Қазақ ұлттық университеті
https://orcid.org/0000-0002-6491-8043
Қазақ ұлттық қыздар педагогикалық университеті
https://orcid.org/0009-0005-1642-9834
Қазақ ұлттық қыздар педагогикалық университеті
https://orcid.org/0000-0002-1993-9566

Кілтті сөздер

алгоритм, дауыс, сөйлеуді тану, ASR, MFCC, MLP

DOI сілтемесі:

https://doi.org/10.58805/kazutb.v.1.26-599

Қалай дәйексөз келтіруге болады

Мекебаев, Н., Д. Даркенбаев, Н. Модовов, і Ж. Орынтаева. «КЛАССИФИКАЦИЯЛЫҚ АЛГОРИТМДЕРДІ ҚОЛДАНЫП ДАУЫСТЫ ТАНУ». ҚазТБУ хабаршысы, вип. 1, вип. 26, Березень 2025, doi:10.58805/kazutb.v.1.26-599.

Аңдатпа

Дауыс тану жүйелері машиналық оқыту әдістеріне негізделген, оның ішінде классификациялық алгоритмдер кеңінен қолданылады. Классификация дауыс сигналдарын әртүрлі санаттарға, мысалы, сөздер немесе сөйлемдерге бөліп тануды жүзеге асырады. Бұл үдерісте жиі қолданылатын алгоритмдерге логистикалық регрессия, шешім ағаштары және нейрондық желілер жатады. Дауыс сигналын өңдеуде алдымен ерекшеліктері, яғни маңызды параметрлері, экстракцияланады, содан кейін олар классификаторға беріледі. Классификация нәтижесінде жүйе сөйлеген сөзді мәтінге түрлендіреді немесе дыбыстың нақты мазмұнын анықтайды. Бұл технология адам-компьютер өзара әрекеттестігін жақсарту үшін маңызды. Бұл мақалада машиналық оқыту әдістерін қолдана отырып, сөйлеушінің даусын анықтау мәселесін шешу үшін жіктеу алгоритмдерін қарастырамыз. Сөйлеудің алдын ала өңдеуде МҒСС-ті алгортимін пайдаландық.  Жоғарыдағы мәселені шешу үшін бес жіктеу алгортмі қарастырылып, салыстырмалы талдау жасалды. Алғашқы эксперимент жасағанда ең жақсы нәтиже көрсеткен SVC алгортимі 0,90 және MLP Classifier алгоритмі 0,83 нәтижелерін көрсетті. Келесі экспермиентте жеке тұлғаның дауысын анықтауда неғұрлым үлкен дәлдікте Robust scaler әдісімен масштабтауда – 0,93 көпқабатты персептрон көрсете бастады. Сондықтан бұл мәселені шешу үшін сөйлеу сигналының ерекшелігін ескеретін көп қабатты перцептронды қолдануға болады.

 

Нұсқалар