Меню
№ 4 (25) - 2024 / 2024-12-31 / Көрілім саны: 12
Авторлар
Кілтті сөздер
DOI сілтемесі:
Қалай дәйексөз келтіруге болады
Ұсынылып отырған мақалада қазақ тілді деректерді сентименталды талдау үшін машиналық оқыту алгоритмдеріне талдаулар жасалынды, талдау нәтижесінде тиімді алгоритмдерді анықтау қарастырылады. Әлеуметтік желілерде, жаңалықтар жəне интернет дүкендердегі қолданушылардың пікірлері сияқты қазақ тіліндегі контенттің көлемі артуына байланысты, қазақ тілді деректерді өңдеу, адамдардың пікірі мен көзқарастары туралы құнды ақпаратты алу құралдары мен əдістеріне де қажеттілік артқан. Сондықтан, зерттеуде қолданылған деректер жиыны (dataset) нақты интернет дүкендер мен жаңалықтар сайтынан жинақталынды. Жианқталған деректердің көлемі 1500 жазба, оның 80% алгоритмдері жаттықтыру үшін, ал 20% тестілеу үшін пайдаланылды. Жинақталған деректерді сентименталды талдау үшін маштналық оқытудың Логистикалық регрессия, Multinomial Naive Bayes, Liner SVM, XGBoost және тереңнен оқытудың Long short-term memory (LSTM) қарастырылды. Зерттеу барысында деректер жиыны 500 жазбадан 1500 жазбаға дейін арттыру арқылы тестер жасалынды, ал алгоритмдердің жеке, ансамбльдік және LSTM алгоритмінің толтырылған тізбектер әдісі сияқты түрлі әдістері жүзеге асырылып тестіленді. Тестілеу барысында алынған нәтижелер алгоритмдердің дәлдік көрсеткіштері бойынша ұсынылды.