Меню
№ 1 (26) - 2025 / 2025-03-31 — Обновлена 2025-03-31 / Кол. просмотров: 60
Авторы
Ключевые слова
DOI ссылка:
Как цитировать
В данной работе рассматривается применение методов машинного обучения для автоматической обработки текстов аннотаций из научных статей. С увеличением объема научной информации исследователи сталкиваются с проблемой информационной перегрузки, что затрудняет поиск и анализ релевантных материалов. Для решения этой задачи мы внедряем алгоритмы машинного обучения, такие как метод опорных векторов (SVM) и представление слов с помощью Word2Vec, что позволяет эффективно классифицировать аннотации и извлекать ключевую информацию. В процессе работы мы осуществляем сбор данных из открытых баз данных. Аннотации проходят этапы предобработки, включая токенизацию, лемматизацию и удаление стоп-слов. Затем мы используем Word2Vec для преобразования текстов аннотаций в векторные представления, которые служат входными данными для модели SVM. Оценка эффективности моделей проводится с использованием метрик точности, полноты и F1-меры. Результаты показывают, что интеграция SVM и Word2Vec значительно улучшает качество классификации аннотаций, что позволяет ускорить процесс поиска научной информации. Работа подчеркивает потенциал использования методов машинного обучения для автоматизации обработки научных текстов и предлагает направления для дальнейших исследований, включая применение более сложных моделей, таких как трансформеры. Данная методология может стать основой для разработки эффективных инструментов, способствующих более быстрому обмену знаниями в научном сообществе