Информационно - коммуникационные и химические технологии

№ 4 (25) - 2024 / 2024-12-31 / Кол. просмотров: 10

ИССЛЕДОВАНИЕ МОДЕЛЕЙ МАШИННОГО И ГЛУБОКОГО ОБУЧЕНИЯ ДЛЯ КЛАССИФИКАЦИИ ВРЕДОНОСНОГО ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ

Авторы

Ключевые слова

вредоносное ПО, информационная безопасность, обнаружение угроз, машинное обучение, глубокое обучение, Chi-square, балансировка классов

DOI ссылка:

https://doi.org/10.58805/kazutb.v.4.25-559

Как цитировать

Жұмабекова A., Усатова O., Қалимолдаев M., Карюкин V., и Бегимбаева Y. . «ИССЛЕДОВАНИЕ МОДЕЛЕЙ МАШИННОГО И ГЛУБОКОГО ОБУЧЕНИЯ ДЛЯ КЛАССИФИКАЦИИ ВРЕДОНОСНОГО ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ». Вестник КазУТБ, т. 4, вып. 25, декабрь 2024 г., doi:10.58805/kazutb.v.4.25-559.

Аннотация

Быстрый рост киберугроз и атак подчеркивает необходимость надежных мер информационной безопасности, конфиденциальности и целостности. Вредоносное ПО, являясь значительной категорией киберугроз, предназначено для нарушения работы, повреждения информационных сред и получения несанкционированного доступа к системам, сетям и данным. Различные виды вредоносного ПО, такие как вирусы, черви, трояны, шпионские программы и руткиты, представляют собой все проникающие и развивающиеся угрозы, часто распространяемые через интернет или съемные устройства. Традиционные методы обнаружения, основанные на сигнатурах, эффективны против известных угроз, но сталкиваются с трудностями в идентификации нового вредоносного ПО. Современные методы, основанные на машинном обучении, предлагают более гибкое решение, обучаясь на больших наборах данных без необходимости использования заранее определенных сигнатур. Данное исследование представляет систему обнаружения вредоносного ПО на основе машинного обучения с использованием набора данных о различных сетевых угрозах. В работе изучены как классические алгоритмы машинного обучения, так и продвинутые модели глубокого обучения, включая полносвязные нейронные сети (DNN), сети с длинной краткосрочной памятью (LSTM) и рекуррентные блоки с управляемыми воротами (GRU), с целью повышения точности обнаружения вредоносного ПО. Все эти модели показали хорошие результаты классификации. Модели машинного обучения Decision Tree, Random Forest и XGBoost превзошли нейронные сети примерно на 0.02. Эксперименты показали, что алгоритмы машинного обучения остаются актуальными в задачах классификации в сфере кибербезопасности. Среди нейронных сетей простая модель DNN показала результат хуже на 0.01, чем LSTM и GRU. Модели рекуррентных сетей LSTM и GRU показали в основном одинаковые результаты. Другой особенностью проведенных экспериментов является то, что модель Random Forest достигла метрики 0.99, став лучшей среди всех остальных.