Ақпараттық-коммуникациялық және химиялық технология

№ 1 (26) - 2025 / 2025-03-31 / Көрілім саны: 70

ҒЫЛЫМИ МАҚАЛАЛАРДАН АВТОМАТТЫ ТҮРДЕ АННОТАЦИЯ МӘТІНДЕРІН ӨҢДЕУ ҮШІН МАШИНАЛЫҚ ОҚЫТУ ӘДІСТЕРІН ҚОЛДАНУ

Авторлар

Л.Н.Гумилев атындағы Еуразия ұлттық университеті
https://orcid.org/0000-0001-5509-8656
Қ.Жұбанов ат.Ақтөбе өңірлік университеті
https://orcid.org/0000-0003-4615-5756
Қорқыт Ата атындағы Қызылорда университеті
https://orcid.org/0000-0001-6479-0759
3Қорқыт Ата атындағы Қызылорда университеті
https://orcid.org/0009-0009-7725-0298
М.Х.Дулати атындағы Тараз өңірлік университеті
https://orcid.org/0000-0002-2000-6720
Л.Н. Гумилев атындағы Еуразия ұлттық университеті
https://orcid.org/0009-0000-8401-5434

Кілтті сөздер

машиналық оқыту, мәтінді автоматты өңдеу, аннотациялар, ғылыми мақалалар, анықтамалық векторлық әдіс (SVM), Word2Vec

DOI сілтемесі:

https://doi.org/10.58805/kazutb.v.1.26-648

Қалай дәйексөз келтіруге болады

Д.Х. K. ., Г.А. S. ., А.Н. Z. ., Г.К. M. ., Б. T. ., і А.Ж. T. . «ҒЫЛЫМИ МАҚАЛАЛАРДАН АВТОМАТТЫ ТҮРДЕ АННОТАЦИЯ МӘТІНДЕРІН ӨҢДЕУ ҮШІН МАШИНАЛЫҚ ОҚЫТУ ӘДІСТЕРІН ҚОЛДАНУ». ҚазТБУ хабаршысы, вип. 1, вип. 26, Березень 2025, doi:10.58805/kazutb.v.1.26-648.

Аңдатпа

Бұл жұмыста ғылыми мақалалардағы аннотация мәтіндерін автоматты түрде өңдеу үшін машиналық оқыту әдістерін қолдану қарастырылады. Ғылыми ақпараттың ұлғаюымен зерттеушілер ақпараттың шамадан тыс жүктелу проблемасына тап болады, бұл тиісті материалдарды табу мен талдауды қиындатады. Бұл мәселені шешу үшін біз аннотацияларды тиімді жіктеуге және негізгі ақпаратты алуға мүмкіндік беретін Word2Vec көмегімен анықтамалық векторлық әдіс (SVM) және сөздерді ұсыну сияқты Машиналық оқыту алгоритмдерін енгіземіз. Жұмыс барысында біз ашық мәліметтер базасынан мәліметтер жинаймыз. Аннотациялар токенизация, лемматизация және тоқтату сөздерін жоюды қоса алғанда, алдын ала өңдеу кезеңдерінен өтеді. Содан кейін біз Аннотация мәтіндерін SVM моделіне кіріс ретінде қызмет ететін векторлық көріністерге түрлендіру үшін Word2Vec қолданамыз. Модельдердің тиімділігін бағалау дәлдік, толықтық және F1 өлшемдерін қолдану арқылы жүзеге асырылады. Нәтижелер SVM және Word2Vec интеграциясы Аннотация классификациясының сапасын айтарлықтай жақсартады, бұл ғылыми ақпаратты іздеу процесін жылдамдатуға мүмкіндік береді. Жұмыс ғылыми мәтіндерді өңдеуді автоматтандыру үшін машиналық оқыту әдістерін қолдану әлеуетіне баса назар аударады және одан әрі зерттеуге, соның ішінде трансформаторлар сияқты күрделі модельдерді қолдануға бағыттар ұсынады. Бұл әдістеме ғылыми қоғамдастықта біліммен жылдам алмасуға ықпал ететін тиімді құралдарды әзірлеуге негіз бола алады

Нұсқалар