Сигнал и шум. Почему одни прогнозы сбываются, а другие – нет - Нейт Сильвер
Шрифт:
Интервал:
Закладка:
Питтсбург, как и Чикаго, – это город, состоящий из пригородов. Размышляя о болезни, исследователи постоянно апеллируют к ним, и поэтому FRED представляет собой своеобразный аналог Питтсбурга – СимПиттсбург (SimPittsburgh) – невероятно детальную имитационную модель, в которой каждый человек представлен «агентом», имеющим семью, сеть социальных контактов, место жительства и набор убеждений и манер поведения, соответствующих его социально-экономическому статусу.
Доктор Джон Грефенстетте, один из ученых питтсбургской команды, прожил в этом городе значительную часть своей жизни, однако до сих пор говорит с заметным иностранным акцентом. Он рассказал мне, как организована работа FRED: «Школы, офисы и больницы размещены в этой модели так же, как в реальном городе. У жителей нашей системы имеются вполне реальные проблемы при записи детей в школы; они не всегда ходят в самую ближнюю – а кроме того, некоторые школы слишком малы, в то время как другие огромны. Это чем-то напоминает игру SimCity». Доктор Грефенстетте и его любезный коллега доктор Шон Браун показали мне некоторые результаты имитационного моделирования, полученные с использованием FRED, на которых волны болезней, раскрашенные разным цветом, распространялись по районам СимПиттсбурга, СимВашингтона или СимФиладельфии. Однако при этом FRED – это серьезный бизнес. Модели такого рода не ищут легких путей, в них должны быть представлены практически все жители города, графства или штата.
Некоторые модели, основанные на агентах, пытаются даже имитировать всю страну или весь мир. Как и погодные модели, они требуют проведения огромного количества расчетов, а следовательно, использования суперкомпьютеров. Естественно, что при проведении расчетов такого рода необходимо правильно учесть демографические данные (это вполне можно сделать, используя результаты переписи населения). Однако модели также должны принимать во внимание куда менее предсказуемое человеческое поведение. Например, насколько велика вероятность того, что 26-летняя мать-одиночка-латиноамериканка пойдет делать прививку? Вы можете провести опрос и спросить ее – основанные на агентах модели довольно сильно полагаются на данные опросов. Однако люди на удивление часто лгут (или забывают), когда речь идет об их действиях, связанных с охраной здоровья: так, они заявляют, что моют руки{529} или используют презервативы{530} гораздо чаще, чем это происходит в реальности.
По словам доктора Грефенстетте, одно довольно устоявшееся правило заключается в следующем: люди готовы принимать участие в неудобных, но ведущих к оздоровлению действиях, таких как вакцинации, если они связаны с достаточно высоким, по их мнению, риском заболеть. Жительница СимПиттсбурга получит прививку от гриппа, если будет считать риск свиного гриппа серьезным. Однако как изменится ее представление о происходящем, если заболеет ее сосед или даже ребенок? Что, если в местных новостях постоянно рассказывают случаи, связанные с гриппом? Самореализующиеся и самоотменяющиеся свойства предсказания заболеваний играют огромную роль в этих моделях с использованием агентов. Поскольку они динамичны и позволяют поведению агента меняться со временем, то в какой-то момент дают возможность получить ответы и на заданные мной чуть выше вопросы.
Можно посмотреть и на работу доктора Даума и его команды из Чикагского университета, которые строят модели, основанные на агентах, для изучения распространения опасного заболевания под названием MRSA[101] -инфекции. Вызывающие ее стафилококки устойчивы к антибиотикам, и в результате обычные ссадины, порезы и синяки могут стать опасными для жизни, а порой привести к неизлечимому заболеванию. MRSA-инфекция – это сложное заболевание с множеством путей распространения: через объятия, открытые раны или через пот или кровь. Порой они могут задерживаться на различных поверхностях, таких как столешницы или полотенца. Часто следы MRSA можно найти в раздевалках, в которых спортсмены обмениваются снаряжением; всплески MRSA время от времени фиксируются у членов футбольных команд разного уровня – от школьных до профессиональных. Задача усложняется еще и потому, что многие люди являются носителями бактерии MRSA, но не заболевают и не страдают от присущих болезни симптомов.
Предпринимая попытку смоделировать действие MRSA, Даум и его коллеги задают себе примерно такие вопросы: люди какого типа используют пластыри, если они получили ссадину или порез? Насколько распространены объятия среди представителей разных культур? Какая доля жителей пригорода сидела в тюрьмах (где стафилококковые инфекции встречаются чаще обычного)?
Используя традиционные модели, даже нельзя рассчитывать на то, чтобы учитывать ответы на подобные вопросы, но модели, основанные на агентах, могут, по крайней мере, предложить нам шанс получить точные прогнозы. Однако командам из Питтсбурга и Чикаго приходится принимать во внимание множество довольно разнообразных переменных. И это необходимо делать всякий раз, когда вы пытаетесь оценивать поведение каждого жителя большой популяции. Работа часто заставляет их изучать вопросы когнитивной психологии, поведенческой экономики, этнографии и даже антропологии: модели, основанные на агентах, используются для изучения ВИЧ-инфекции в различных сообществах – от жителей джунглей Папуа – Новой Гвинеи{531} до завсегдатаев гей-баров Амстердама{532}. И в этом случае нужны довольно глубокие знания местных обычаев и привычек.
Учитывая вышесказанное, стоит заметить: агентное моделирование – исключительно смелое занятие, и в группах, работающих в этой области, часто собраны звезды из лучших и ярчайших представителей различных дисциплин. Однако даже при наличии всей этой интеллектуальной элиты их усилия часто подрываются нехваткой данных. «Даже в случае H1N1 довольно сложно получить детальные географические данные о том, кто, когда и где заболел, – жалуется Грефенстетте. – И вы не поверите, насколько сложно получать данные о всплесках болезни, имевших место в прошлом».
Во время разговора с участниками команд в Чикаго и Питтсбурге я иногда вспоминаю о красивых новых торговых центрах в Китае. Центрах, в которых есть невероятные интерьеры – римские колонны, американские горки и венецианские каналы, – но нет посетителей или магазинов-арендаторов. Исследователи из обеих команд уже пришли к некоторым невероятно полезным и действенным заключениям. Например, доктор Грефенстетте вычислил, что закрытие школ может приводить к неблагоприятным последствиям, если происходит слишком быстро или слишком ненадолго, а команда из Чикагского университета пришла к выводу, что необычно большое количество случаев заболеваний MRSA-инфекцией в центральной части Чикаго было вызвано перемещением людей в окружную тюрьму Кук и из нее. Однако по большей части модели заточены под создание прогнозов на будущее и готовы использовать данные, которых еще нет.
Модели, основанные на методах агентного моделирования, в отличие от методов, используемых при создании прогноза погоды, которые могут уточняться ежедневно, сложно протестировать. Вспышки серьезных заболеваний возникают не так уж часто. И даже хорошие модели могут пасть жертвой собственного успеха из-за присущего им свойства самоотмены. В данном случае правильное предсказание будущего способно изменить ход событий: будущее станет значительно более благоприятным. Представьте себе, что модель говорит о том, что некое действие – например, закрытие школ в одном графстве – может оказаться очень эффективным. И это действие срабатывает! Распространение болезни в условиях реального мира замедляется. Но это же заставляет модель выглядеть в ретроспективе слишком пессимистичной.
Именно поэтому команды из Питтсбурга и Чикаго не решаются использовать свои модели для создания конкретных предсказаний. Другие ученые были менее осторожны в преддверии всплеска свиного гриппа 2009 г., и кое-кто выдал достаточно плохие предсказания{533}, иногда значительно недооценивая масштабы распространения гриппа.
В настоящее время работа команд ограничена в основном тем, что коллега доктора Даума Чип Масал называет «моделирование для глубокого понимания». Иными словами, агентное моделирование может помочь нам проводить эксперименты, позволяющие больше узнать об инфекционном заболевании, но пока что маловероятно, что они помогут предсказать их всплеск.
Что делать, когда прогнозы неутешительны
Итак, оказалось, что две последние и значительные волны страхов, вызванных гриппом в Соединенных Штатах, оказались достаточно беспочвенными. В 1976 г. не наблюдался всплеск заболеваний, вызванных вирусом N1H1, за исключением случаев в Форт-Дикс, а программа массовой вакцинации президента Форда начала казаться чрезмерной. В обоих случаях прогнозы правительства относительно масштабов вспышки заболевания были достаточно неточными.