Архивы программирование - Open Forecast

Пакет greybox для R

Ivan Svetunkov — Fri, 04 May 2018 12:22:35 +0000

На днях я разместил в CRAN новый пакет — greybox (серый ящик). Идея названия произрастает из принципов моделирования, в соответствии с которыми все модели могут быть условно разделены на три типа:

Чёрный ящик — модель, в которой неизвестны ни структура, ни параметры. Мы видим только входной и выходной сигналы
Белый ящик — модель, в которой известно всё. Можно сказать, что это детерминированная модель, в ней нет никакой случайности, и всё предопределено.
Серый ящик — нечто среднее, между предыдущими двумя. Фактически это и есть та самая стохастическая модель, с которой мы обычно имеем дело в прогнозировании.

Так что пакет greybox, фактически может включать в себя всё, что угодно, связанное с моделированием. Однако акцент в нём будет сделан на процессе построении регрессионных моделей и выборе объясняющих переменных.

Этот пакет мне оказался нужным по нескольким причинам:

У меня накопилось несколько функций, которые не подходили к другим пакетам (в т.ч. к пакету smooth). Они все так или иначе относятся к регрессиям и к построению моделей;
Мои исследования и работа в университете в последнее время оказываются связанными с регрессиями и выбором наилучшей модели. Для этого нужны разные функции (например, для комбинирования моделей), и мне оказалось проще написать одну свою, нежели использовать несколько из разных пакетов.
В CRAN не нашлось пакетов для выбора моделей и последующего использования их в прогнозировании, которые полностью меня бы устраивали. Кроме того, мне не нравится тяга многих пакетов к p-values и проверке статистических гипотез. Мы живём в 21 веке, и уже существуют другие инструменты для выбора моделей и анализа результатов.

Поэтому я решил, что надо сделать свой пакет с теми функциями, которые нужны мне, реализованными в том виде, в каком я считаю их необходимыми.

На данный момент в пакет перекочевали функции xregExpander() и stepwise() из пакета smooth, а так же функция ro() из пакета TStools. На тему первых двух на сайте уже была отдельная статья, а по поводу работы третьей можно почитать в виньетах пакета (к сожалению, только на английском).

Пакет будет развиваться и обновляться, а я буду периодически писать о том, как всё это движется.

Сообщение Пакет greybox для R появились сначала на Open Forecast.

Пакет «smooth» для R. Функция es(). Часть 1

Ivan Svetunkov — Fri, 14 Oct 2016 15:29:45 +0000

Итак, свершилось! Пакет, над которым я работал последние года полтора, наконец выложен в CRAN. Как это водится, вся документация в пакете — на английском языке: и винеты, и даже написанный мною собственноручно огроменный документ с подробным описанием того, что там творится внутри. Поэтому, чтобы донести смысл пакета до рускоязычной аудитории, я попытаюсь в серии постов рассказать о том, что за функции находятся в пакете, зачем они нужны, как работают и что дают.

Начнём мы с Экспоненциального сглаживания.

Что такое es(), и зачем она нужна?

Вообще «ES» это сокращение от Exponential Smoothing (Экспоненциальное сглаживание). В R для этого уже существует функция под названием ets(), она входит в пакет «forecast» Роба Хайндамана. В связи с этим может возникнуть вопрос: «Зачем нам ещё одна функция экспоненциального сглаживания?». На него у меня есть несколько ответов:

Функция ets() не позволяет строить некоторые смешанные модели экспонениального сглаживания. Например, ETS(A,A,M), которая лежит в основе классического метода Хольта-Уинтерса, не доступна. Из исследовательского интереса, в попытке восстановить справедливость, я реализовал все 30 моделей экспоненциального сглаживания. Ни в чём себе не отказывайте!
ets() не позволяет включать в модель экзогенные переменные. То есть, если вы считаете, что на объём продаж мороженого может влиять температура, но вы хотите использовать ещё и модель экспоненциального сглаживания, то вам можно только посочувствовать. Или можно было до появления пакета «smooth». Функция es() позволяет включать либо вектор с экзогенной переменной, либо матрицу с экзогенными переменными. Прогнозируйте мороженое правильно!
В области прогнозирования есть общее представление о том, что комбинирование прогнозов разных моделей позволяет увеличивать их точность. Так Стефан Коласса применил идею с комбинированием на основе инфорационных критериев к моделям экспоненциального сглаживания и показал, что точность прогнозов от этого увеличивается. В функции es() этот механизм комбинирования реализован. Даёшь комбинацию!
Число сезонных коэффициентов в функции ets() ограничено 24. Причиной этого является сложность оптимизации моделей, в которых число коэффициентов оказывается большим. В функции es() такого ограничения нет. Я считаю, что пользователь должен сам нести ответственность за свои действия, ограничивать его как маленького ребёнка не стоит. Однако, если у вас высокочастотные данные и большое количество параметров, возможно стоит попробовать другие методы инициализации экспоненциального сглаживания. Будьте бдительны!
Собственно говоря, методы инициализации вектора состояний — это ещё один элемент, выгодно отличающий мою функцию от функции Роба. В случае с es() пользователь может либо оптимизировать стартовое значение, либо рассчитать его с помощью процедуры «backcasting», либо задать вручную. Выбор за вами!
Помимо стандартных методов оценки параметров модели, в es() вы можете ещё встретить методы, основанные на минимуме MAE, траекторных функций и HAM. Зачем? А затем, что они позволяют получать более робастные модели, что может быть необходимо, например, в случаях с высокочастотными данными. Ну, и ещё просто потому, что так интересней жить!
В литературе по прогнозированию существует тьма тьмущая методов построения прогнозных интервалов. В функции es() есть выбор из трёх: параметрические, полупараметрические и непараметрические. В каких-то случаях, например, непараметрические интервалы могут оказаться значительно более полезными, нежели параметрические. В конце концов, не сошёлся же клином мир на нормальном распределении!
Статистическая модель в основе es() несколько отличается от модели в основе ets(). В частности, в случае с мультипликативными ошибками es() использует допущение о лог-нормальном законе распределения ошибок (а не нормальном, как в случае с классической ETS). Это оказывается особенно важно, когда уровень прогнозируемой величины близок к нулю. Вы не поверите, на какие чудеса способна лог-нормальная модель!
es() позволяет работать с целочисленными данными и ситуациями с нулевыми значениями (то что в заморской литературе называется «intermittent demand»). Пока что в функции реализованы модель Кростона, TSB и модель с фиксированной вероятностью. Всё это основано на текущем исследовании с Джоном Бойланом и ещё будет дорабатываться. Следите за обновлениями!
Ну, и последнее, это замечательный параметр holdout, который позволяет делить выборку на две части на лету и оценивать точность прогнозов по тестовой выборке. Где ещё вы найдёте такую прелесть?!

Замечу, что при этом функция es() не обязательно гарантирует вам более точные прогнозы, чем ets(). Мною замечено, что на разных данных она ведёт себя по-разному: где-то лучше ets(), где-то хуже. Главное преимущество функции заключается в её гибкости. Если вам эта гибкость ненужна, а нужно просто, чтобы работало, то рекомендую обратиться к ets().

Сообщение Пакет «smooth» для R. Функция es(). Часть 1 появились сначала на Open Forecast.

Smooth — новый пакет для R

Ivan Svetunkov — Sat, 30 Jan 2016 17:11:42 +0000

Давно ничего не появлялось на страницах этого блога. Пора бы исправить этот пробел.

Сегодня, 30 января 2016 года, начинает свою жизнь пакет для R под названием «smooth». Пока что он публикуется только на сайте github.com, но в перспективе он появится и в CRAN, что облегчит многим жизнь и позволит забыть о всяких Rtools и devtools. Что же входит сейчас в этот замечательный пакет?

es() — функция по оценке экспоненциального сглаживания и построению прогнозов. Об этой функции я уже писал раньше здесь, здесь и здесь.
ces() — комплексное экспоненциальное сглаживание. Оценка и прогнозирование. Об этой функции я тоже уже писал здесь.
ges() — обобщённое экспоненциальное сглаживание. Подробней об этой функции я напишу позже, когда разберусь, что же она такое делает и как.
nus() — метод неравномерного сглаживания. Он был рассмотрен во втором томе нашего учебника по прогнозированию. Когда-нибудь я напишу о нём и на этом сайте…
ces.auto() — функция позволяет выбрать наилучшую модель комплексного экспоненциального сглаживания из двух: сезонной и не сезонной. Скорее всего, эта функция со временем покинет пакет «smooth», так как этот функционал должен по хорошему быть внедрён в функцию ces().
sim.ets() — функция позволяет генерировать временные ряды на основе модели экспоненциального сглаживания (ETS). Возможно, будет переименована в simulate.ets(), когда es() начнёт использовать классы в R.
sim.ces() — функция позволяет генерировать временные ряды на основе модели комплексного экспоненциального сглаживания (CES). Участь её ждёт такая же, как и sim.ets().

В пакет входит также несколько вспомогательных функций, таких как graphmaker() (построение линейных графиков) и коэффициенты для расчёта ошибок прогнозирования (MPE, MAPE, SMAPE, MASE, GMRAE). И конечно же, в пакет входит критически важная функция sowhat(), которая проверяет произвольные запросы на адекватность.

Чтобы установить пакет, нужно совсем ничего — только пара строк кода в R:

if (!require("devtools")){install.packages("devtools")}
devtools::install_github("config-i1/smooth")

Замечу, что с пакетом «TStools» при этом ничего плохого не произойдёт. Я продолжаю его поддерживать, и Ланкастерский Центр Прогнозирования продолжает постепенно добавлять новые функции в пакет. Функция es() при этом какое-то время будет в нём обновляться, но затем будет оттуда окончательно перенесена в «smooth».

Сообщение Smooth — новый пакет для R появились сначала на Open Forecast.

TStools v1.6 и функция es()

Ivan Svetunkov — Sat, 05 Dec 2015 15:10:05 +0000

С момента последней записи о функции es() прошло уже достаточно времени, и, конечно же, я не бездельничал, а она не стояла на месте. Что же нового появилось? Давайте посмотрим.

Построение прогнозных интервалов. Пока что с помощью функции можно получать полупараметрические и непараметрические интервалы. Первые используют ковариационную матрицу многошаговых ошибок (см. Продвинутые методы оценки), вторые используют идею с квантильными регрессиями Taylor and Bunn, 1999. По умолчанию в es() используется первый метод, так как второй оказывается не очень точным в случае с небольшим числом наблюдений. До параметрических интервалов пока руки не дошли — слишком муторные формулы.
Построение комбинированной модели экспоненциального сглаживания. Для построения такой модели нужно использовать параметр model=»CCC». В этом случае функция оценит все возможные модели ETS, рассчитает информационные критерии и на основе них построит комбинацию. В основе комбинации лежит известный метод весов Акайке (AIC Weights), подробно о котором в контексте экспоненциального сглаживания написал Stephan Kolassa, 2011. В моей функции не обязательно перебирать все модели ETS. Можно их ограничить, например, вот так: model=»CCN» (скомбинировать все несезонные модели) — или так: model=»ACC» (скомбинировать все модели с аддитивной ошибкой). В общем, любой каприз за ваши деньги…
В качестве целевых функций добавлены «MAE» и нечто под названием «HAM» — «Half Absolute Moment» (Половинный абсолютный момент). Оба они позволяют получить более робастные оценки, чем использующаяся по умолчанию «MSE«. HAM при этом ещё более робастен, чем MAE, причём настолько, что даёт модальные оценки, а не медианные. Помимо этого скорость вычислений с HAM на порядок выше скорости MAE, которая в свою очередь выше скорости MSE. Пока что, правда, оптимизатор не всегда находит глобальный минимум HAM, но я постараюсь это исправить… когда-нибудь… в будущем…
Выбор модели при использовании любой целевой функции. Делается это на основе всё тех же информационных критериев (и расчёта выборочной дисперсии), что не совсем корректно (так как функция правдоподобия получается не максимизированной), но это хоть какое-то решение на данный момент.
Ну, и, конечно же, как всегда, код оптимизирован, скорость вычислений увеличена, баги исправлены.

Отдельное спасибо Dmytro Perepolkin за интересные предложения и отловленные баги.

Сообщение TStools v1.6 и функция es() появились сначала на Open Forecast.

Обновления в функции «es» в R

Ivan Svetunkov — Mon, 05 Oct 2015 15:34:49 +0000

С момента последней записи о функции экспоненциального сглаживания в R прошло уже почти два месяца. А за это время в функции произошёл ряд изменений:

Я её переименовал из «ets2» в более благозвучное es() — «Exponential Smoothing»;
Функция теперь позволяет использовать экзогенные переменные. Делается это через параметр xreg. В параметр можно подавать как вектора (то есть только одну переменную), так и матрицы (то есть несколько переменных). Главное условие — это чтобы экзогенная переменная имела либо размер обучающей выборки, либо такой же, как и вся выборка в целом. То есть, если длина интересующей нас переменной y составляет 50 наблюдений, 40 из которых — обучающая выборка, а 10 — тестовая, то функция спокойно примет некую переменную x, если в той будет 40 или 50 наблюдений;
Кроме того, es() теперь позволяет строить полупараметрические и непараметрические прогнозные интервалы. Первые рассчитываются на основе траекторной матрицы, вторые — на основе идеи Taylor and Bunn, 1999. Параметрических пока нет — слишком сложно и требует много времени, которого пока не нашлось;
Ну, и, конечно же, код ещё раз оптимизирован, а несколько багов исправлены.

Функция всё так же входит в пакет «TStools» и пока всё ещё доступна только с сайта github, до cran мы пока не добрались.

Напомню, чтобы получить последнюю версию пакета «TStools» с упомянутой функцией, в R достаточно набрать:

if (!require("devtools")){install.packages("devtools")}

devtools::install_github("trnnick/TStools")

Сообщение Обновления в функции «es» в R появились сначала на Open Forecast.

Функция es для R

Ivan Svetunkov — Tue, 11 Aug 2015 22:00:06 +0000

Данная статья многим может показаться совершенно непонятной. Оно и не удивительно, к моделям экспоненциального сглаживания мы ещё в учебнике не подобрались, а вот программу для них уже обсуждаем… Что же поделаешь?! Жизнь жестока!

Итак, в R для построения моделей экспоненциального сглаживания существует прекрасная функция ets() из пакета forecast, которым занимается Rob J.Hyndman. Пакет находится в общих репозиториях и легко устанавливается командой в R:

install.packages("forecast")

Однако у этой функции с моей точки зрения есть несколько недостатков, среди которых можно выделить следующие:

Отсутствие некоторых моделей экспоненциального сглаживания;

В книге «Forecasting with Exponential Smoothing» Роб с соавторами предлагают таксономию, в соответствии с которой существует всего 30 моделей экспоненциального сглаживания, однако функция ets() позволяет строить только 19 из них, опуская сложные в оценке модели (включая оригинальную модель Хольта-Уинтерса).

Отсутствие возможности задавать произвольные значения компонент;

Для инициализации любой модели экспоненциального сглаживания нужно задать самое первое расчётное значение либо первые значения компонент уровня ряда, тренда и сезонной составляющей. В ets() они подбираются во время оптимизации, но иногда стартовые значения имеет смысл задать вручную. Именно этой возможности в ets() и нет.

Невозможность включения экзогенных (внешних) переменных;

В той же книге обсуждается, что в модель пространства состояний, в виде которой авторы представляют любое экспоненциальное сглаживание, можно легко включить произвольное количество экзогенных переменных, которые объяснили бы поведение нашего показателя в некоторые моменты времени. Однако возможность включения переменных в функции ets() отсутствует. Пока она отсутствует и в моей функции «es», но в списке приоритетов она не на последнем месте.

Ограниченность критериев в целевой функции

ets() позволяет оценивать модели, используя либо простую сумму квадратов отклонений, либо функцию правдоподобия, либо среднюю абсолютную ошибку… Но траекторных критериев в функции нет. Под траекторными понимаются такие критерии, которые учитывают прогнозную траекторию модели и минимизируют ошибку не на один шаг вперёд, а на несколько.

Отсутствие возможности разбиения выборки на тестовую и проверочную.

Иногда нам нужно просто проверить, как себя поведёт та или иная функция на выбранном ряде данных. Для того, чтобы сопоставить фактические значения с прогнозными с помощью функции ets() нужно сделать много лишних движений.

Этих недостатков мне показалось достаточно для того, чтобы написать свою функцию, но главной проблемой моей функции всё это время была скорость работы. Недавно я переписал главные куски кода в C++, и теперь скорость выросла в разы (порядка 30 раз). Теперь мне за свою функцию не стыдно и можно о ней немного рассказать.

Установить функцию можно легко если в вашем R есть пакет «devtools» (мы это уже кратко обсуждали в статье про CES). Однако при сборке под Windows вам может понадобиться программа под названием «Rtools». Скачать её можно отсюда, устанавливать лучше в корневой каталог. Так же для сборки понадобятся пакеты Rcpp и RcppArmadillo:

install.packages("Rcpp")
install.packages("RcppArmadillo")

В случае возникновения проблем, рекомендую просмотреть статью про основы R.

После этого установка пакета с функцией es() (от английского «Exponential Smoothing») выполняется следующей командой:

devtools::install_github("trnnick/TStools")

В этот репозиторий я загружаю уже протестированные функции, а всё самое весёлое и потенциально плохо работающее я загружаю в свой пакет «prognosis». Если вы смелый, ловкий, умелый, то милости прошу установить пакет «prognosis».

После установки подключим пакет в R:

library("TStools")

А теперь посмотрим, что нам даёт эта функция es(). Возьмём для примера какой-нибудь ряд из базы M3. Например, N1234. Для того, чтобы сравнить прогнозные и фактические значения на проверочной выборке, предварительно объединим тестовую и проверочную части в одну переменную $ y $:

y <- ts(c(M3$N1234$x,M3$N1234$xx),frequency=frequency(M3$N1234$x),start=start(M3$N1234$x))

И для начала попросим функцию самостоятельно выбрать наилучшую модель экспоненциального сглаживания и дать прогноз на 8 наблюдений вперёд.

es(y,h=8,holdout=TRUE)->test

В результате этого получим следующий график:

График ряда N1234 и модели ETS(A,A,N), построенной по нему.

и вывод в консоль:

Building model: ANN AAN AAdN AMN AMdN ANA AAA AAdA AMA AMdA ANM AAM AAdM AMM AMdM MNN MAN MAdN MMN MMdN MNA MAA MAdA MMA MMdA MNM MAM MAdM MMM MMdM ... Done! 
"Time elapsed: 4.04 seconds"
"Model constructed: MAN"
"Persistence vector: 0.672, 0.233"
"Initial components: 7036.588, 7.801"
"Residuals sigma: 0.008"
"CF type: one step ahead; CF value is: 4677"
"Biased log-likelihood: -258"
"AIC: 515.97 AICc: 516.97"
"MASE: 4.82"
"MASALE: 3.72%"

Разберём построчно, что же мы тут получили.

В первой строке перечислены все опробованные модели, и слова в ней добавляются по мере построения модели.

В строке [2] показано время, потраченное на работу программы. Эта информация позволяет нам прикинуть, сколько может занять работа программы по массиву похожих временных рядов. 8 секунд - это, конечно, немало. Надеюсь, в будущем я смогу ещё оптимизировать код и довести этот показатель до 2 - 3 секунд.

Строка [3] показывает выбранную функцией модель. Это модель с аддитивной ошибкой, аддитивным трендом, без сезонности. Этой модели соответствует метод Хольта.

Строкой [4] перечислены оптимальные постоянные сглаживания, которые функция es получила в ходе расчётов.

[5] - это стартовые значения компонент уровня и тренда в модели Хольта.

[6] - это стандартное отклонение остатков полученной модели.

В строке [7] написано, какой критерий использовался при оценке. "One step ahead" соответствует минимизации средней квадратической одношаговой прогнозной ошибки. Подробней о критериях скоро можно будет прочитать в готовящейся к публикации статье "Методы оценки параметров моделей" в разделе Инструментарий прогнозиста.

CF value в той же строе [7] - это значение полученной целевой функции. Особо полезной информации не несёт, но позволяет проводить элементарное сравнение между моделями, построенными по одному и тому же ряду данных.

[8] Biased log-likelihood - смещённое значение логарифмированной функции правдоподобия. Техническая деталь, не несущая особой пользы человечеству. Будет убрана в следующем релизе.

Информационные критерии AIC и AICc в строке [9] позволяют проводить более корректно сравнение между моделями. Общий принцип - чем меньше значение, тем ближе модель к некой "истинной", лежащий где-то там, в основе мироздания. Для модели ETS(M,A,N), как видим, получились такие вот значения. Для сравнения, для сезонной модели ETS(A,A,A), построенной по этому же ряду, у меня получились такие значения: "AIC: 526.862 AICc: 532.005". Это говорит о том, что модель ETS(M,A,N) ближе к истине, чем ETS(A,A,A), что неудивительно - в нашем ряде данных сезонности нет. Информационные критерии мы ещё обсудим в будущем параграфе "Выбор прогнозной модели" раздела "Инструментарий прогнозиста".

Пунктами [10] и [11] показаны ошибки прогноза. Первая - это "Mean Absolute Scale Error", а вторая - такая же, отличающаяся лишь знаменателем в формуле. Чем меньше значение, тем точнее оказался прогноз. Подробней о них мы поговорим во всё том же разделе "Инструментарий прогнозиста". Но не сегодня.

Но и это ещё не всё. Переменная test, в которую мы сохранили результаты работы нашей функции, содержит в себе кучу всего интересного (вызываемого командой вида test$var, где var - это имя переменной):

persistence - вектор постоянных сглаживания. Может содержать от 1 до 3-х следующих элементов: $\alpha, \beta, \gamma $.
phi - значение коэффициента демпфирования. Имеет смысл только в случае, если построена модель с демпфированным трендом.
states - матрица, содержащая компоненты экспоненциального сглаживания. В случае с нашей моделью ETS(A,A,N) содержит 2 столбца: уровень и тренд. Её можно так же представить графически следующим образом:
```
plot(test$states)
```
Должен получиться вот такой график:

Компоненты модели ETS(M,A,N) по ряду N1234 в динамике
fitted - расчётные значения в тестовой выборке.
forecast - прогноз по модели (соответствующий проверочной выборке).
residuals - остатки модели, соответствующие одношаговым ошибками, полученным по тестовой выборке.
errors - матрица ошибок модели. В случае, если использовался стандартный критерий "One step ahead" совпадает с остатками residuals. В случае с другими критериями содержит итоговую матрицу многошаговых ошибок.
x - исходный ряд данных (весь ряд, отправленные функции).
ICs - информационные критерии AIC и AICc, рассчитанные для модели.
CF - значение целевой функции.
FI - матрица "информация Фишера". Получается из функции правдоподобия и нужна для расчёта дисперсий коэффициентов. В R ковариационную матрицу коэффииентов на основе неё можно легко получить с помощью следующей команды:
```
solve(-test$FI)
```

Мы можем попросить es() построить нам какую-нибудь конкретную модель экспоненциального сглаживания, а не выбранную автоматически. Для этого надо передать функции название модели. Например, для модели демпфированного тренда ETS(A,Ad,N) нужно ввести:

es(y,model="AAdN",h=8,holdout=TRUE)->test

Вывод в консоль будет аналогичным предыдущему, а график получится такой:

График ряда N1234 и модели ETS(A,Ad,N), построенной по нему.

es() может построить и всякие "запрещённые" в ets() модели. Например, по ряду N2568 самой близкой к "идеальной" будет модель ETS(A,Ad,M), которая соответствует методу Хольта-Уинтерса и в ets() недоступна. Выглядит это графически вот так:

Ряд N2568 и прогноз по модели ETS(A,Ad,M).

es() так же может находить параметры из классических и из расширенных границ для постоянных сглаживания. Я лично считаю, что только расширенные границы и нужно использовать при оценке моделей экспоненциального сглаживания, но некоторые прогнозисты со мной не согласны (но мы их со временем переубедим. На нашей стороне правда и Keith Ord). По умолчанию в функции используются классические границы, но расширенные включаются достаточно легко:

y <- ts(c(M3$N2568$x,M3$N2568$xx),frequency=frequency(M3$N2568$x),start=start(M3$N2568$x))
es(y,h=18,holdout=TRUE,bounds="admissible")->test

Вместо слова "admissible" можно ввести и просто первую букву - "a".

Из-за того, что расширенные границы больше классических, во время оптимизации могут получаться другие оптимальные значения параметров. Для нашего сезонного ряда N2568 оптимальной моделью теперь будет ETS(M,A,M), которая позволяет построить более точный прогноз по ряду. Графически это выглядит так:

Ряд 2568 и модель ETS(M,A,M)

И вот мы подобрались к самому интересному. Достаточно важной особенностью функции es() является возможность использовать тракеторные целевые функции. По умолчанию используется нечто под названием "TLV" - Total Logarithmic Variation. Суть метода заключается в том, что вместо одношаговой ошибки на каждом наблюдении производится многошаговая (от 1 до h, где h - срок прогнозирования). Затем по этим ошибкам рассчитываются дисперсии, которые логарифмируются, суммируются и минимизируются. На сайте на эту тему есть статья. Напомним, что использование "TLV" позволяет увеличивать точность долгосрочных прогнозов при незначительном уменьшении точности краткосрочных. Помимо TLV есть ещё "GV" - generalised variance, "TV" - Total Variation и "hsteps" - ошибка прогноза на h шагов вперёд. При использовании TLV и GV можно так же легко использовать процедуру выбора наилучшей модели. А вот использование этой процедуры в случаях с TV и hsteps ничем теоретически не обосновано.

Посмотрим, что получится, если использовать траекторную целевую функцию для того же сезонного ряда N2568:

es(y,h=18,holdout=TRUE,trace=TRUE)->test

Оптимальной остаётся всё та же функция ETS(M,A,M), параметры отличаются незначительно, но точность прогноза вырасла - ошибка уменьшилась с 8,71% до 6,37%. А всё из-за того, что во втором случае лучше выявлены долгосрочные тенденции.

Про методы оценки моделей можно почитать здесь, а можно - и просто посмотреть презентацию, которую я делал в Глазгоу - там вкратце описана идея траекторных целевых функций.

Пока по es() всё. Функция всё ещё разрабатывается и дорабатывается. Следите за обновлениями!

Сообщение Функция es для R появились сначала на Open Forecast.

Комплексное экспоненциальное сглаживание для R

Ivan Svetunkov — Wed, 04 Mar 2015 13:05:22 +0000

Какое-то время назад я разработал функцию, позволяющую строить прогнозы с использованием модели Комплексного экспоненциального сглаживания (Complex Exponential Smoothing — CES). Эта функция опубликована на сайте github под лицензией GPL v.3. С помощью этой функции можно давать прогнозы на произвольные промежутки времени как для не сезонных, так и для сезонных временных рядов. Кроме того, функция позволяет включать в модель экзогенные переменные. Давайте рассмотрим пример того, как она работает.

Для того, чтобы установить эту функцию себе на компьютер нужно установить пакет smooth из CRAN:

install.packages("smooth")

В качестве альтернативы можно установить пакет из GitHub. Для этого:

1. Установить пакет «devtools», если он не установлен:

if (!require("devtools")){install.packages("devtools")}

2. Установить пакет «CES» с сайта github:

devtools::install_github("config-i1/smooth")

После того, как пакет установился, подключаем его в R:

library("CES")

Возьмём для наших примеров временной ряд №387 из базы рядов M3. Для того, чтобы база рядов была доступна, в R надо установить и подключить пакет «Mcomp»:

install.packages("Mcomp")
library("Mcomp")

Построим график по ряду:

plot(M3$N0387$x,ylab="Series N0387")

Вот он:

Ряд N0387 из базы рядов M3

Этот ряд относится к годовым, для таких рядов в M3 строят прогнозы на срок в 6 лет. Построим CES и дадим точечный и интервальный прогнозы. Делается это с помощью следующей команды:

ces(M3$N0387$x,h=6,intervals=T) -> test

Функция выдаёт много информации и возвращает кучу векторов и матриц. Поэтому мы используем «-> test» для сохранения этих данных в отдельный объект. Кроме того, она возвращает нам следующую информацию:

"Time elapsed: 0.19 seconds"
"Model constructed: Complex Exponential Smoothing"
"a0 + ia1: 1.88365413369954+0.97087980257933i"
"ABS Eigenvalues for stability condition:"
0.9364115 0.1399830
"CF value is: 1574102"
"AIC: 264.846; AICc: 267.922; BIC: 268.407; CIC:260.846"

Разберём по пунктам, что мы тут получили.

[1] — нам сообщают, что на построение модели ушло 0,19 секунд, что хорошо. Иногда, когда наблюдений много (например, 100), построение функции может затянуться на десятки секунд. Вызвано это тем, что R достаточно медленная программа. Возможно, я как-нибудь займусь C++ и перепишу код функции, тогда она будет работать значительно эффективней и быстрей. Но это планы на будущее. Сразу же стоит заметить, что скорость вычислений будет меняться от компьютера к компьютеру. Чем мощнее ваш железный конь, тем быстрее будут найдены оптимальные параметры модели.

[2] — нам сообщили, что построили модель Комплексного экспоненциального сглаживания. Альтернативы — та же модель, только с сезонностью.

[3] — мы видим значение комплексной постоянной сглаживания. По ней самой можно сказать, что CES даст прогноз на снижение (так как мнимая часть меньше единицы) и что ряд данных испытывает значительные изменения (так как действительная часть близка к 2).

[4] и [5] — далее нам выдали значения собственных чисел матрицы дисконтирования. Если все они меньше единицы, то полученная модель стабильна (то есть старые значения не влияют на прогноз). Если бы модель получилась нестабильной, нам бы об этом сообщили.

[6] — после этого мы видим значение целевой функции (сумма квадратов ошибок), которое само по себе полезной информации несёт немного.

[7] — и последнее — значения информационных критериев. Помимо трёх первых стандартных тут ещё рассчитывается комплексный информационный критерий (Complex IC — CIC), который представляет собой AIC с другим числом степеней свободы (см. соответствующую заметку).

Функция «ces» так же строит такой график:

Ряд N0387 и его прогноз по CES

Чтобы использовать прогноз CES, нам достаточно запросить его у R. Точечный прогноз:

test$forecast

Интервальный прогноз:

test$high
test$low

Если же нас интересует, насколько точно модель дала прогноз, мы можем включить тестовую выборку и немного изменить исходный запрос на:

x <- ts(c(M3$N0387$x,M3$N0387$xx),frequency=frequency(M3$N0387$x),start=start(M3$N0387$x))
ces(x,h=6,intervals=T,holdout=T) -> test

Первой строчкой мы объединили обучающую (M3$N0387$x) и тестовую (M3$N0387$xx) выборки в одну и сохранили это всё как объект «x» имеющий тип «ts» — временной ряд.

Второй строкой мы построили модель CES по обучающей выборке и дали прогноз на тестовую: команда holdout=T сообщает о том, что из всего ряда нужно h=6 последних наблюдений использовать для тестовой выборки. В результате использования этой команды мы получим немного другой вывод в командную строку:

"Time elapsed: 0.17 seconds"
"Model constructed: Complex Exponential Smoothing"
"a0 + ia1: 1.88365413369954+0.97087980257933i"
"ABS Eigenvalues for stability condition:"
0.9364115 0.1399830
"CF value is: 1574102"
"AIC: 264.846; AICc: 267.922; BIC: 268.407; CIC:260.846"
"MASE: 0.614"
"MASE.lvl: 5.224%"

Как видим, значения [1] — [7] идентичны предыдущему выводу, однако к ним добавились [8], сообщающий нам значение MASE для прогноза и [9] сообщающий нечто похожее только с делением на среднюю величину по исходному ряду данных. Эти значения сами по себе нам ни о чём не говорят, но позволяют сравнивать точность прогнозов разных моделей. MASE здесь используется, так как это наиболее адекватная и наименее смещённая мера точности прогноза. MASE.lvl так же является несмещённой, но при этом имеет некую интерпретацию, аналогичную обычной средней абсолютной процентной ошибки аппроксимации (MAPE).

График всего это выглядит следующим образом:

Ряд N0387 вместе с тестовой выборкой и его прогноз по CES

Как видим, прогноз оказался достаточно точным. Впрочем, для какого-то однозначного вывода нужно его сравнить с прогнозами по другим моделям, чего в рамках это статьи мы пока делать не будем.

CES так же умеет строить прогнозы по сезонным временным рядам. Для этого ей нужно передать вектор типа «ts» и задать тип сезонной модели. Например, для сезонного ряда N2568 из M3 команда будет иметь следующий вид:

ces(M3$N2568$x,h=18,seasonality="F",intervals=T) -> test

Выбранная сезонность здесь — «полная» или «комплексная». Она позволяет моделировать как аддитивную, так мультипликативную сезонность во временных рядах. В коде так же реализованы частичная («P»), она же просто аддитивная, сезонность и простая сезонная модель «S», не имеющая тренда. Подробней обо всём это можно будет почитать в скором времени в статье, которая готовится к выпуску.

А вот вывод нашей команды:

Non-stable model estimated! Use with care! To avoid that reestimate ces using 'bounds=TRUE'.
"Time elapsed: 4.34 seconds"
"Model constructed: Complex Exponential Smoothing with a full (complex) seasonality"
"a0 + ia1: 1.13652538578959+1.00295810649073i"
"b0 + ib1: 1.66249591228014+1.02106035157178i"
"ABS Eigenvalues for stability condition:"
1.0043258 0.6192850 0.1573755 0.1164405
"CF value is: 36299094"
"AIC: 2079.247; AICc: 2101.13; BIC: 2161.855; CIC:2047.247"

Как видим, R сообщил нам, что построена нестабильная модель (красная строка). Он нам так же предложил переоценить модель с параметром «bounds=TRUE», который отвечает за подбор параметров исключительно в области стабильных параметров. Это имеет смысл сделать, так как в противном случае прогноз может быть неадекватным и непредсказуемым (как бы это забавно не звучало), однако скорость вычислений в таком случае снизится.

Из нового в данном выводе — название модели (с полной сезонностью) и значение сезонной комплексной постоянной сглаживания [5]. Всё остальное аналогично предыдущему примеру. Заметим, что одно из собственных чисел в строке [7] оказалось больше единицы, что как раз и привело к жуткой красной надписи.

Перезапустим функцию с предложенным параметром:

ces(M3$N2568$x,h=18,seasonality="F",intervals=T,bounds=T) -> test

Итоговый вывод и прогноз изменятся:

"Time elapsed: 36.72 seconds"
"Model constructed: Complex Exponential Smoothing with a full (complex) seasonality"
"a0 + ia1: 1.14042311450241+0.99312271083681i"
"b0 + ib1: 1.62771138458957+1.04585709733533i"
"ABS Eigenvalues for stability condition:"
0.9999924 0.5183545 0.2109118 0.1898389
"CF value is: 36209112"
"AIC: 2078.959; AICc: 2100.842; BIC: 2161.567; CIC:2046.959"

Время на вычисления теперь заняло 36,72 секунды, что почти в 10 раз больше, чем в предыдущий раз. Однако это привело к получению стабильной модели и нахождению коэффициентов, которые гарантируют немного меньшее значение целевой функции. Прогноз по CES в этом случае выглядит так:

Ряд N2568, CES и прогноз

Мы могли бы так же поиграться с тестовой выборкой, но делать этого не будем. Попробуйте проделать это сами ;).

Функция «ces» так же позволяет включать экзогенные переменные. В этом случае нужно ей передать в параметре «xreg» либо вектор (обычный либо «ts»), соответствующей переменной, либо матрицу (или «data.frame»), длинна которой должна либо соответствовать обучающей выборке, либо соответствовать обучающей выборке + горизонту прогнозирования. В первом случае значения экзогенных переменных экстраполируются методом Naïve.

К сожалению, под рукой у меня нет рядов данных, для которых можно было бы использовать экзогенные переменные, так что демонстрацию этой функции оставим на будущее.

Ну, и последнее, что включено в пакет «CES» — это функция «ces.auto», которая автоматически выбирает подходящую модель из несезонной / сезонной в зависимости от выбранного ряда данных. Делается это на основе информационного критерия. По умолчанию используется CIC, хотя можно попросить функцию выбрать и другой критерий. Посмотрим, как работает функция для ряда N2568:

ces.auto(M3$N2568$x,h=18,intervals=T,bounds=T) -> test

Построения моделей занимает какое-то время, но в конце концов мы получаем следующий вывод:

"Estimating CES with seasonality = 'N'"
"Estimating CES with seasonality = 'F'"

"The best model is with seasonality = 'F'"
"AIC: 2078.959; AICc: 2100.842; BIC: 2161.567; CIC: 2046.959"

Информации выводится немного, всё основное содержится в объекте «test». Самое главное — это то, что модель точно определила, что перед ней сезонный ряд данных.

Попробуем использовать эту же функцию для какого-нибудь ряда с аддитивной сезонностью и включим модель частичной сезонности. Для примера рассмотрим ряд N1192. Это ряд квартальных данных, период упреждения прогноза в нём обычно берётся равным 8 наблюдений.

x <- ts(c(M3$N1192$x,M3$N1192$xx),frequency=frequency(M3$N1192$x),start=start(M3$N1192$x))
ces.auto(x,h=8,model.types=c("N","P","F"),holdout=T,bounds=T,intervals=T) -> test

Параметр «model.types» передаёт функции все названия типов CES, которые нужно проверить по ряду данных. В результате применения этой функции получаем:

"Estimating CES with seasonality = 'N'"
"Estimating CES with seasonality = 'P'"
"Estimating CES with seasonality = 'F'"

"The best model is with seasonality = 'P'"
"AIC: 204.001; AICc: 234.001; BIC: 210.954; CIC: 197.001"
"MASE: 0.721"
"MASE.lvl: 3.885%"

Наилучшая модель — это модель с частичной сезонностью, так как ряд данных имеет аддитивную сезонную компоненту. Выглядит прогноз следующим образом:

Ряд N1192, CES и прогноз

Чисто графически видно, что точечный прогноз оказался недостаточно точным. Вызвано это малым количеством данных — точность CES повышается с ростом числа наблюдений. Тем не менее будущие значения попали в прогнозный интервал, так что не всё потеряно.

Применение той же команды для какого-нибудь другого ряда, только без сезонности, приводит к выбору несезонной модели CES. Можете поверить на слово, а можете сами проверить. Например, на ряде N1041.

По CES пока всё. Как только что-нибудь появится новое, обязательно напишу.

До новых встреч!

Сообщение Комплексное экспоненциальное сглаживание для R появились сначала на Open Forecast.