Итак, теперь у нас есть общие представления о моделировании и шкалах. Мы можем что-нибудь измерить и на основе полученных данных попытаться построить элементарные модели. Однако прежде чем делать это, нужно понять, с чем именно мы имеем дело.
Да, нас окружают системы, да они генерируют море информации, но что же из всей этой информации существенно для нас? Температура воздуха — 12 градусов по Цельсию. Курс доллара — 59.26 рублей за доллар. Нефть колеблется в цене. В Петербурге в гостинице «Holday Inn» прошёл съезд националистов. Халк простудился, Файзулин вернётся в апреле. Всё это — информация, которая так или иначе влияет на нас, наши жизни, а так же кучу всяких показателей, многие из которых мы не измеряем и даже представить себе не можем, как измерить. Изменится ли как-нибудь посещаемость матчей Зенита из-за того, что Халк простудился? Вырастет ли число посетителей гостиницы «Holiday Inn» после такого события? Сколько будет стоить еда из-за того, что курс доллара стал 59.26? Повлияет ли как-нибудь на пробки в городе эта вот температура воздуха
Всё это вопросы, ответы на которые могли бы потенциально помочь нам получить более точный прогноз и принять правильное решение. Однако многое из этого — это просто шум, которые на изучаемый показатель влияет незначительно. Ну, или по крайней мере влияет незначительно в данный момент времени. Возможно, если температура воздуха будет -10, то количество машин на улицах не будет значительно отличаться условий с температурой в 10 градусов. Но стоит ей упасть до -30, уверен, что ситуация изменится существенно. Более того, если бы действие нашего повествования происходило в начале 90-х, то влияние температуры на загруженность дорог было бы ещё более существенным: количество автомобилей в то время, безусловно, было меньше, но пропорция тех, которые надо заводить «с верёвки» было значительно выше. Получается, что изменение одних факторов может приводить к одним и тем же изменениям в изучаемом показателе, а влияние других на результат может меняться, причём не только в зависимости от их величины, но и от времени.
Однако давайте по порядку. Если мы классифицируем процессы, с которыми сталкиваемся в прогнозировании, то мы сможем применить к ним подходящие модели, что позволит нам получить более точные прогнозы. Попробуем сделать это.
Классическая эконометрика выделяет следующие два типа процессов:
- стационарные,
- нестационарные.
Узкое определение стационарности гласит о том, что распределение изучаемой случайной величины остаётся постоянным во времени. Широкое определение немного мягче — в соответствии с ним стационарный процесс — это тот, в котором случайная величина имеет постоянное математическое ожидание и дисперсию.
Грубо говоря, стационарный процесс — это тот, в котором изучаемый нами показатель колеблется в некоторых фиксированных пределах, не растёт и не снижается во времени.
Что же такое «нестационарный процесс»?
Эконометрика резонно говорит о том, что это такой процесс, в котором математическое ожидание и/или дисперсия случайной величины меняется во времени. То есть, если продажи валенок растут, то этот процесс продаж нестационарен. Дисциплина под названием «анализ временных рядов» так же говорит нам, что практически любой нестационарный процесс может быть приведён к стационарному путём взятия разностей и / или логарифмирования. Точно так же прокрустово ложе может быть применено к любому человеку для достижения «нормального» состояния.
Заметим, что в этих определениях ничего не говорится об изменениях в связях между факторами, так как предполагается, что эти изменения либо не происходят, либо могут быть описаны нелинейными функциями, либо просто не интересуют исследователя. Действительно, если вас интересует только динамика посетителей музея «История Сталинизма» и ответы на вопросы «зачем?» и «почему» вам ненужны, то нечего раздумывать: посещаемость либо представляет собой стационарный, либо нестационарный процесс. Прогноз в таком случае может быть вполне приемлемым, но не обязательно точным.
Но, конечно же, нас эта ситуация устроить не могла и не может. Именно поэтому в нашем учебнике по прогнозированию приводится достаточно сложная классификация, которая была призвана разделить все возможные процессы на несколько типов. Вот она:
Мне она, честно говоря, кажется несколько громоздкой. Я предпочитаю более простую версию этой классификации, в соответствии с которой процессы бывают:
- обратимые:
- стационарные,
- нестационарные,
- необратимые:
- хаотические,
- эволюционные,
К обратимым процессам мы будем относить те, в которых с течением времени не происходит качественных изменений. Такие процессы могут быть смоделированы некоторым набором переменных и влияние их на интересующий нас показатель со временем либо не изменится, либо изменится несущественно. Например, продажи белого хлеба в магазине «Тикси» могут быть подвержены множеству различных факторов, но влияние их обычно со временем меняется несущественно, так как хлеб для многих потребителей этого магазина (да и многих других) — базовый продукт. С этой позиции эти продажи можно считать обратимым процессом.
Включение в «обратимые» процессы стационарных и нестационарных кажется вполне логичным и легко объяснимо теми соображениями, что мы обсудили выше. Те же самые продажи хлеба в краткосрочной перспективе будут носить, скорее всего, стационарный характер, а в долгосрочной перспективе (из-за роста численности населения, например) могут вырасти, демонстрировать нестационарную динамику.
Необратимый процесс — это процесс, в котором со временем происходят существенные изменения в связях между факторами и результатом. Эти изменения в связях, конечно же, могут быть объяснены появлением либо исчезновением каких-нибудь сторонних факторов (либо качественными изменениями в работе системы), но в рамках выбранной модели не объяснимы.
Эволюционные процессы характеризуются плавными изменениями в связях, которые соответствуют необратимым изменениям в структуре изучаемой системы. Изменение технологий производства, оптимизация кадров, внедрение инноваций (не говоря уже о макроэкономических событиях и прочих внешних воздействиях на объект исследования) — всё это может быть причиной таких изменений. К таким процессам могут относиться, например, продажи автомобилей ВАЗ-2106. Помимо очевидных факторов, влияющих на этот показатель (цены на шестёрку, цены на автомобили конкурентов, среднедушевые доходы населения и т.п.), можно выделить ещё и факторы, которые будут проявляться только со временем. Например, характеристики нашего автомобиля: устаревший дизайн, отсутствие стеклоподъёмников и подстаканников и т.д. — в 2015-м году имеют большую значимость, чем в каком-нибудь 1985-м.
Для того, чтобы определить, имеем ли мы дело с эволюционным процессом, достаточно провести мысленный эксперимент. Представьте, что будет, если перенести изучаемый объект в прошлое: сохранятся ли связи, будет ли исследуемая система такой же (с учётом небольших отклонений)? Если утвердительный ответ на этот вопрос дать не получается, то мы имеем дело с эволюционным процессом.
Заметим, что в некоторых случаях эволюция в социальных системах протекает достаточно медленно, так, что для целей прогнозирования ею можно пренебречь. В этом случае имеет смысл воспринимать исследуемый процесс как обратимый. Однако, где находится грань между обратимостью и необратимостью — вопрос, ответ на который может дать только сам исследователь.
Последний в нашей классификации — хаотический процесс — это такой, при котором происходят резкие, непредсказуемые изменения в связях. В чистом виде хаотические процессы встречаются крайне редко, обычно они происходят в переходные периоды или в моменты кризиса, когда система вышла из одного стабильного состояния, но ещё не перешла в новое. Например, в самом начале в зоне боевых действий связь между стоимостью продуктов питания и объёмом спроса на них может претерпевать подобные неожиданные изменения.
Предложенная нами классификация позволяет принять более взвешенное решение относительно того, какой тип модели использовать для прогнозирования. Например, использование простой регрессионной модели для прогнозирования цены на нефть марки Brent может быть не до конца оправданным из-за тех самых необратимых процессов в формировании цены. Одновременно с этим использование моделей с изменяющимися во времени параметрами (Time Varying Parameters) для прогнозирования погоды так же может быть неоправданным, однако уже наоборот: из-за отсутствия этой самой необратимости.
Заметим, что если бы в нашем распоряжении были все факторы, влиявшие в прошлом, влияющие сейчас и в будущем на изучаемый показатель, то динамику этого показателя мы могли бы легко объяснить, а значит никакой «необратимости» изучаемого процесса и не было бы. Однако это достижимо только в идеале. В реальности мы вынуждены строить модели и принимать решения в условиях ограниченности ресурсов. Нельзя объять необъятное.