Вы возможно слышали что-то о пандемии COVID-19 (последние новости из Великобритании: несколько часов назад правительство объявило о введении ограничений на перемещение людей в связи с виросом. Теперь можно только ходить в магазин за продуктами и то 1 раз в 3 дня). Число новостей, мемов и просто шума по этому поводу давно перевалило за разумный уровень. Но что меня поражает больше всего, так это количество ненаучных статей на тему анализа и прогнозирования пандемии. Многие экономисты, аналитики, прогнозисты, специалисты в области машинного (и не очень) обучения, да и просто неравнодушные люди, кинулись проводить анализ и прогнозирование в этой области. Неожиданно все вокруг стали экспертами и могут с лёгкостью рассуждать о том, чего ждать, сколько случаев заражения будет на следующей наделе, сколько людей умрёт, сколько случаев заражения будет в США к 31 Марта 2021 года и так далее. Эти эксперты используют симуляции, экспоненциальное сглаживание, ARIMA, Байесовские методы, нейронные сети, экспертные методы и вообще всё, что знают для того, чтобы провести свою аналитику / построить прогнозы. У меня уже голова болит от всего этого шума, и я не считаю, что то, что делают эти люди — полезно и нужно. И вот почему.
Почему?
Во-первых, без знания конкретной предметной области, вся аналитика и всё прогнозирование просто сводятся к управжнениям по построению моделей. Это весело, но это не делает вас экспертами в этой области. Если вы считаете, что можно просто построить красочный график или отфильтровать шум и дать прогноз, для того, чтобы получить какой-то разумный результат, то вы серьёзно ошибаетесь. Любая аналитика должна делаться с учётом природной специфичности области, а не в вакууме. Не стоит просто так применять какую-нибудь ARIMA к ряду данных и считать, что вы сделали что-то полезное. Без понимания проблемы, это превращается просто в упражнения по работе в Excel / R / Python. Кстати, Роб Хайндман написал по этой же теме пост пару дней назад.
Во-вторых, мы на самом деле не знаем настоящую ситуацию. Данные, с которыми мы работаем, скорее всего, некорректные и неполные. Например, страны в эти дни перестают делать тесты всем подряд, боясь ещё большего распространения вируса. Но даже делая тесты, мы не можем точно сказать, сколько у нас заражённых на самом деле по многим разным причинам. Строя модели по неправильным данным, вы, конечно же, получите неправильные выводы. Есть одно исключение — это если вы используете специальные модели из данной области при поддержке экспертов (см. «во-первых» и ссылку на блог Роба).
В-третьих, все эти упражнения по анализу и прогнозированию совершенно не помогают в принятии каких-либо осмысленных решений. Они делаются чисто для любопытства, без особых целей. Например, какой-нибудь эксперт спрогнозировал, что число заразившихся вирусом во всём мире к 31 марта 2021 года будет от 53 до 530 миллионов человек. Ну, и что? Какое решение можно принять на основе такого прогноза? Никакое. Что могут сделать люди с этим прогнозом? Ничего. Это просто прогноз для самого себя (и возможно для самопиара). COVID-19 — это сейчас хайповая тема в аналитике, и можно заработать себе баллы и привлечь к себе внимание просто делая что-то в этой области. Но вклад в функционирование общества подобные аналитика и прогнозирование не вносят практически никакого.
Что делать?
Вместо того, чтобы делать подобные бессмысленные прогнозы, можно сфокусироваться, например, на том, чего ожидать в экономике из-за вируса. Карантин, само-изоляция и закрытие общественных пространств серьёзно бьют по экономике. К сожалению, судя по всему, эпидемию в отдельной взятой стране без этого не остановить. Перед нами встаёт делема: закрывать и вредить экономике или же не закрывать и вредить здоровью общества. В связи с этим можно попробовать найти ответы на следующие вопросы:
- Как вирус будет распространятся в разных сценариях (полное закрытие страны / частичное закрытие / никакого закрытия)?
- Что будет с экономикой в этих сценариях?
- Что произойдёт с бизнесом во время изоляции?
- Как много компаний обанкротится из-за вируса?
- Какие типы компаний обанкротятся первыми?
- Как вся эта ситуация повлияет на цены на продукты?
- Как много людей потеряет работу из-за удара по экономике?
Ответы на эти и другие вопросы значительно более полезны и выжны. Они могут помочь принять решения прямо здесь и сейчас, пока не поздно. Скорее всего, всякие ARIMA и экспоненциальное сглаживание не помогут в ответах на эти вопросы. Судя по всему, нужно использовать экспертные методы, обращаясь за помощью к специалистам в области эпидемиологии и экономики.
Другой интересный пример — это панические покупки, которые уже повредили цепям поставок во многих странах. Люди неожиданно стали покупать в среднем на 200% больше, чем обычно. В связи с этим можно задать ряд вопросов, связанных с исследованием операций:
- Как цепь поставок отреагирует на это в краткосрочной перспективе?
- Каков будет эффект этих панических покупок в долгосрочной перспективе?
- Когда это закончится и когда спрос вернётся к своему нормальному уровню?
- Что будет со спросом по окончанию паники?
Ответы на эти вопросы тоже важны и помогают в принятии решений разным группам людей. Да, найти правильные ответы сложно, но они могут принести реальную пользу.
Резюмируя
Я не дам вам никаких прогнозов по COVID-19, просто потому что я не эксперт. Но я могу точно сказать, что по этому поводу слишком много хайпа, паники и шума. Мы (прогнозисты, экономисты, аналитик и пр.) должны помогать обществу, а не создавать ещё больше шума и паники. Поэтому, если вы хотите что-то поанализировать и попрогнозировать на тему COVID-19, а потом выложить это на всеобщее обозрение, подумайте по поводу того, как это поможет людям. Если не поможет, то просто не делайте этого.