Меню
№ 2 (23) - 2024 / 2024-06-30 / Кол. просмотров: 93
Авторы
Ключевые слова
DOI ссылка:
Как цитировать
База данных, полученная из архива данных rp5, предоставлена ООО "Расписание погоды" и представляет собой собранную информацию о погодных условиях во всех частях света, описывающую температуру, облачность и осадки, и доступна для анализа всем желающим. Данные собираются каждые 3 часа, что позволяет получать ценные сведения изо дня в день. Многие из этих функций являются необязательными и зависят от времени, например, максимальная температура в ночное время, дальность видимости ночью всегда равна нулю и т. д. Цель данного исследования - создать решение, которое сможет справиться с отсутствующими данными, и найти важную комбинацию машинного обучения для предсказания погоды. Следует отметить, что исследование должно проводиться на открытых данных, поскольку они не содержат никаких предпосылок. Работая с сырыми и открытыми данными, мы можем попытаться установить новые правила в моделировании прогноза погоды и найти значимые решения для казахстанского общества. Для данного исследования были использованы алгоритмы реализации моделей прогнозирования из библиотеки scikitlearn Python. Она содержит регрессоры Gradient Boosting Regressor, XGBoost, CatBoost, Linear Regression, Bayesian Ridge и другие. Применяемые алгоритмы машинного обучения оценивались на основе различных подходов: от различных идей предварительной обработки данных до выбора лучшей модели с лучшими результатами и ее оптимизации для достижения возможного максимума в прогнозах. Ключевым направлением данного исследования является помощь в поиске оптимального подхода к решению задач прогнозирования погоды и анализ того, как на это могут смотреть современные тенденции.