Ақпараттық-коммуникациялық және химиялық технология

№ 4 (25) - 2024 / 2024-12-31 / Көрілім саны: 12

ҚАЗАҚ ТІЛІНДЕГІ ПІКІРЛЕРДІ СЕНТИМЕНТАЛДЫ ТАЛДАУ ҮШІН МАШИНАЛЫҚ ОҚЫТУДЫҢ ТИІМДІ АЛГОРИТМДЕРІН АНЫҚТАУ

Авторлар

  • Н.К. Мукажанов
  • Л.Ш. Черикбаева
  • А.М. Касенхан
  • Ж.М. Алибиева
  • М. Тұрдалыұлы

Кілтті сөздер

сентименталды талдау, машиналық оқыту, тереңдете оқыту, NLP, пікірлер, деректер жинағы.

DOI сілтемесі:

https://doi.org/10.58805/kazutb.v.4.25-426

Қалай дәйексөз келтіруге болады

Мукажанов N. ., Черикбаева L. ., Касенхан A. ., Алибиева Z. ., і Тұрдалыұлы M. . «ҚАЗАҚ ТІЛІНДЕГІ ПІКІРЛЕРДІ СЕНТИМЕНТАЛДЫ ТАЛДАУ ҮШІН МАШИНАЛЫҚ ОҚЫТУДЫҢ ТИІМДІ АЛГОРИТМДЕРІН АНЫҚТАУ». ҚазТБУ хабаршысы, вип. 4, вип. 25, Грудень 2024, doi:10.58805/kazutb.v.4.25-426.

Аңдатпа

Ұсынылып отырған мақалада қазақ тілді деректерді сентименталды  талдау үшін машиналық оқыту алгоритмдеріне талдаулар жасалынды, талдау нәтижесінде тиімді алгоритмдерді анықтау қарастырылады. Әлеуметтік желілерде, жаңалықтар жəне интернет дүкендердегі қолданушылардың пікірлері сияқты қазақ тіліндегі контенттің көлемі артуына байланысты, қазақ тілді деректерді өңдеу, адамдардың пікірі мен көзқарастары туралы құнды ақпаратты алу құралдары мен əдістеріне де қажеттілік артқан. Сондықтан, зерттеуде қолданылған деректер жиыны (dataset) нақты интернет дүкендер мен жаңалықтар сайтынан жинақталынды. Жианқталған деректердің көлемі 1500 жазба, оның 80% алгоритмдері жаттықтыру үшін, ал 20% тестілеу үшін пайдаланылды. Жинақталған деректерді сентименталды талдау үшін маштналық оқытудың Логистикалық регрессия, Multinomial Naive Bayes, Liner SVM, XGBoost және тереңнен оқытудың Long short-term memory (LSTM) қарастырылды. Зерттеу барысында деректер жиыны 500 жазбадан 1500 жазбаға дейін арттыру арқылы тестер жасалынды, ал алгоритмдердің жеке, ансамбльдік және LSTM алгоритмінің толтырылған тізбектер әдісі сияқты түрлі әдістері жүзеге асырылып тестіленді. Тестілеу барысында алынған нәтижелер алгоритмдердің дәлдік көрсеткіштері бойынша ұсынылды.