Kodduu Python

Ниже пример использования библиотеки Darts для прогнозирования временных рядов на Python. В этом примере мы будем использовать модель LightGBM для прогнозирования пассажиропотока авиалиний.


import pandas as pd
import matplotlib.pyplot as plt
from darts import TimeSeries
from darts.datasets import AirPassengersDataset
from darts.models import LightGBMModel
from darts.metrics import mape

# Загрузка датасета "Air Passengers"
series = AirPassengersDataset().load()

# Разделение данных на обучающую и тестовую выборки (80% и 20%)
train, val = series.split_before(0.8)

# Инициализация модели LightGBM
model = LightGBMModel(lags=12)

# Обучение модели на обучающей выборке
model.fit(train)

# Прогнозирование на горизонте, равном длине тестовой выборки
forecast = model.predict(len(val))

# Вычисление ошибки MAPE
error = mape(val, forecast)
print(f"MAPE: {error:.2f}%")

# Визуализация результатов
plt.figure(figsize=(12, 6))
series.plot(label='Фактические данные')
forecast.plot(label='Прогноз')
plt.legend()
plt.title('Прогнозирование пассажиропотока авиалиний с помощью Darts')
plt.show()

Объяснение кода:

- Импорт библиотек:
- pandas и matplotlib для работы с данными и их визуализации.
- Модули из darts, включая TimeSeries, встроенные датасеты, модели и метрики.

- Загрузка данных:
- Используем встроенный датасет AirPassengersDataset, содержащий ежемесячные данные о количестве авиапассажиров с 1949 по 1960 год.

- Создание временного ряда:
- Данные преобразуются в объект TimeSeries, который является основным классом для работы с временными рядами в Darts.

- Разделение данных:
- Разбиваем данные на обучающую и тестовую выборки в соотношении 80/20 с помощью метода split_before.

- Инициализация модели:
- Используем модель LightGBMModel, указав lags=12, что означает использование данных за предыдущие 12 месяцев для прогнозирования.

- Обучение модели:
- Модель обучается на обучающей выборке с помощью метода fit.

- Прогнозирование:
- Прогнозируем будущие значения на горизонте, равном длине тестовой выборки, с помощью метода predict.

- Оценка модели:
- Вычисляем метрику MAPE (Mean Absolute Percentage Error) между прогнозными и фактическими значениями тестовой выборки.

- Визуализация:
- Строим график фактических и прогнозных данных для наглядной оценки качества модели.

Дополнительный контекст по библиотеке Darts:

Darts — это мощная библиотека Python с открытым исходным кодом для анализа и прогнозирования временных рядов. Она предоставляет единый и простой в использовании интерфейс для различных моделей, включая:

- Классические статистические модели: ARIMA, Exponential Smoothing и др.
- Модели машинного обучения: LightGBM, Random Forest и др.
- Модели глубокого обучения: RNN, LSTM, TCN и др.

Основные преимущества Darts:

- Унифицированный интерфейс: Позволяет легко переключаться между моделями и сравнивать их.
- Поддержка многомерных временных рядов: Работает с одномерными и многомерными данными.
- Интеграция с другими библиотеками: Совместима с pandas, numpy и другими популярными библиотеками.
- Продвинутые функции:
- Обработка пропущенных значений.
- Масштабирование и нормализация данных.
- Возможность добавления экзогенных переменных.
- Поддержка вероятностного прогнозирования и ансамблирования моделей.

Когда использовать Darts:

- Разработка и прототипирование моделей: Быстрое тестирование различных моделей на ваших данных.
- Комплексные проекты: Когда требуется использование сложных моделей глубокого обучения или обработка многомерных временных рядов.
- Научные исследования: Для экспериментов с новыми архитектурами моделей и методами прогнозирования.

Установка библиотеки Darts:

Перед началом работы необходимо установить библиотеку Darts:


pip install darts

120 views07:10