Все построено на комбинации множества различных количественных моделей и подходов. Если быть точнее, то в «ансамбле» 23 различных модели, которые можно разделить на 7 групп:
- Простые статистические модели — продление последних приростов, либо различные AR (авторегрессионные)-модели
- Модели, использующие фьючерсную кривую (да-да, мы знаем, что просто фьючерсная кривая — это плохой прогноз для спотовой цены), в различных интерпретациях.
- Модели, использующие кривую процентных ставок (в долларах США).
- Модели, использующие изменения курсов сырьевых валют (CAD и AUD)
- Модели, использующие сырьевые индексы Commodity Research Bureau (СRB) — как ни странно, это довольно хорошо работает.
- Методы машинного обучения — lasso, ridge, random forest, boosted trees.
- Прогнозы, которые публикует Energy Information Administrations в рамках публикации STEO — Short-Term Energy Outlook).
В справочном документе есть подробные объяснения по каждой из используемых моделей.
Итак, у нас есть 23 модели, которые могут прогнозировать цену нефти. Что дальше? Можно представить это следующим образом. У вас есть 23 эксперта, каждый из которых ежемесячно дает свой прогноз нефтяной цены на следующие 12 месяцев вперед. Вам необходимо построить на их основе свой прогноз. Вы можете, к примеру, взять простое среднее прогнозов, и это может вполне неплохо работать. Мы используем более сложный подход и динамическим образом меняем веса каждого эксперта на основе его точности out-of-sample. То есть, каждый месяц мы смотрим, насколько хорошо этот эксперт-модель справлялся с прогнозированием на основе его ошибки. Если хорошо — то постепенно увеличиваем его долю в ансамбле, если нет — то уменьшаем. Существует несколько различных подходов, как можно агрегировать прогнозы, мы используем те подходы, которые реализованы в пакете opera для R.
Вы можете посмотреть, что ансамбль прогнозировал на любой из месяцев, начиная с января 2010 года. Что модель прогнозировала в ноябре 2014 или феврале 2016 года? Здесь нет никаких секретов, вы легко можете это посмотреть (и сравнить с фьючерсной кривой и прогнозами STEO) и вновь убедиться, что прогнозировать действительно сложно. Все прогнозы построены out-of-sample, то есть, только та информация, который была известна на дату прогноза, используется для построения прогноза на соответствующую дату. На отдельном листе можно посмотреть прогнозы отдельных «экспертов-моделей», здесь тоже нет секретов.
Другим важным параметром, который часто упускается из виду при построении прогнозов, является доверительный прогноз. Какова неопределённость прогноза, насколько вы в нем можете быть уверены? Для того, чтобы ответить на этот вопрос, мы строим эмпирические доверительные прогнозы. На всей истории уже построенных out-of-sample прогнозов, мы проанализировали величину ошибку на каждом из горизонтов (от 1 до 12) и строим доверительный интервал на основе средней ошибки, которая была допущена в прошлом. По ширине доверительного интервала вы снова видите, что прогнозировать цены на нефть сложно.
Это вообще работает? Справедливый вопрос. Как вы знаете, стандартным бенчмарком для любого ценового прогноза является прогноз no-change. То есть, на достаточно большом горизонте средняя ошибка вашего прогноза меньше ошибки no-change («продленной»» цены на следующие 12 месяцев) или нет? Если нет, это означает, что лучше смотреть на текущую цену и утверждать, что это лучший прогноз для будущей цены – эта цена сегодня. На отдельном листе вы можете сравнить ошибку «ансамбля» по сравнению с ошибкой no-change. На горизонте до 3 месяцев разница между ними невелика, но постепенно увеличивается. Это говорит о том, что «что-то в этом есть».
Небольшое техническое уточнение – в ансамбле прогнозируется цена WTI, так как в прогнозах EIA STEO по ней более длинная история.
Модель доступна по отдельному адресу в полному экране.