Информационно - коммуникационные и химические технологии

№ 2 (23) - 2024 / 2024-06-30 / Кол. просмотров: 94

СРАВНЕНИЕ И АНАЛИЗ РАЗНЫХ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ПРОГНОЗИРОВАНИЯ ТЕМПЕРАТУРЫ ПОГОДЫ НА ОСНОВЕ ОТКРЫТЫХ ДАННЫХ

Авторы

Казахско-Британский Технический Университет

Ключевые слова

машинное обучение, погода, прогнозирование, интеллектуальный анализ, Data Mining, статистический анализ, эпидемиология, корреляция.

DOI ссылка:

https://doi.org/10.58805/kazutb.v.2.23-404

Как цитировать

Каир D. . «СРАВНЕНИЕ И АНАЛИЗ РАЗНЫХ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ПРОГНОЗИРОВАНИЯ ТЕМПЕРАТУРЫ ПОГОДЫ НА ОСНОВЕ ОТКРЫТЫХ ДАННЫХ». Вестник КазУТБ, т. 2, вып. 23, июнь 2024 г., doi:10.58805/kazutb.v.2.23-404.

Аннотация

База данных, полученная из архива данных rp5, предоставлена ООО "Расписание погоды" и представляет собой собранную информацию о погодных условиях во всех частях света, описывающую температуру, облачность и осадки, и доступна для анализа всем желающим. Данные собираются каждые 3 часа, что позволяет получать ценные сведения изо дня в день. Многие из этих функций являются необязательными и зависят от времени, например, максимальная температура в ночное время, дальность видимости ночью всегда равна нулю и т. д. Цель данного исследования - создать решение, которое сможет справиться с отсутствующими данными, и найти важную комбинацию машинного обучения для предсказания погоды. Следует отметить, что исследование должно проводиться на открытых данных, поскольку они не содержат никаких предпосылок. Работая с сырыми и открытыми данными, мы можем попытаться установить новые правила в моделировании прогноза погоды и найти значимые решения для казахстанского общества. Для данного исследования были использованы алгоритмы реализации моделей прогнозирования из библиотеки scikitlearn Python. Она содержит регрессоры Gradient Boosting Regressor, XGBoost, CatBoost, Linear Regression, Bayesian Ridge и другие. Применяемые алгоритмы машинного обучения оценивались на основе различных подходов: от различных идей предварительной обработки данных до выбора лучшей модели с лучшими результатами и ее оптимизации для достижения возможного максимума в прогнозах. Ключевым направлением данного исследования является помощь в поиске оптимального подхода к решению задач прогнозирования погоды и анализ того, как на это могут смотреть современные тенденции.