Сигнал и шум. Почему одни прогнозы сбываются, а другие – нет - Нейт Сильвер
Шрифт:
Интервал:
Закладка:
Рис. 7.5. Изменение количества вновь поставленных диагнозов ВИЧ и сифилиса, геи, Сан-Франциско, 1998–004 гг.
Как оказалось, решение парадокса заключалось в том, что геи начали активнее использовать так называемый серосортинг, иными словами, они выбирали половых партнеров с тем же статусом ВИЧ, что и у них. Не до конца понятно, как им удавалось это организовать, однако этот факт был задокументирован детальными поведенческими исследованиями, проведенными в Сан-Франциско{522}, Сиднее{523}, Лондоне и других городах с большими популяциями геев. Возможно, что положительную роль сыграли и кампании в области здравоохранения – часть из них переключилась с идеи борьбы с «усталостью от презервативов» на «обсуждаемую безопасность». Также не исключено и влияние интернета, заменившего бары в качестве лучшего места для поиска половых партнеров. В интернете существуют другие нормы по разглашению информации: многие мужчины указывают в профилях на специализированных сайтах свой статус ВИЧ, а кроме того, в интернете проще задавать интимные вопросы (и получать честные ответы), чем на танцполе{524}.
В чем бы ни состояла причина, было ясно, что это специфическое и локализованное поведение не вполне соответствует простым моделям заболевания – к счастью, в данном случае это означало, что прогнозы исследователей в отношении ВИЧ оказались слишком пугающими. Модели, основанные на различных состояниях, предполагают, что у каждого человека имеется свой уровень восприимчивости к болезни. Это допущение не работает столь же точно в случае болезней, требующих более близкого контакта, или в случаях, когда уровень риска является асимметричным для различных групп населения. Иными словами, вы не можете зайти в продуктовый магазин и выйти из него зараженным ВИЧ.
Почему не сработали модели в Форт-Дикс
Однако даже в случае более простых заболеваний компартментальные модели[97] могут оказаться неприменимыми из-за слишком общих и нестрогих допущений, заложенных в них. Рассмотрим, например, корь.
Корь – это первая болезнь, которую (вследствие ее простоты) начинают изучать будущие эпидемиологи в рамках программы PhD[98]. «Корь представляет собой удобную модель для изучения системы инфекционного заболевания, – утверждает Марк Липсиц, коллега Озоноффа по Гарварду. – Она одномерна. Ее можно выявить с помощью анализа крови, у нее имеется лишь один штамм, и у всех заболевших проявляются одни и те же симптомы. Переболев ею, вы не заразитесь второй раз». Если бы нужно было назвать единственную болезнь, идеально описываемую SIR-моделью, то специалисты выбрали бы корь.
Однако в 1980‑х и начале 1990‑х гг. в Чикаго был зафиксирован ряд необычно тяжелых всплесков кори, которые эпидемиологи не могли предсказать. В соответствии с традиционной моделью, прививки имелись у такого количества жителей города, которого должно было быть достаточного для формирования так называемого коллективного иммунитета – своего рода биологического эквивалента брандмауэра, благодаря которому болезнь не имеет возможности развиваться и затухает сама собой. Однако в отдельные годы на протяжении 1980‑х корью заболевало не менее 1000 жителей города – в основном маленькие дети. Проблема показалась настолько тревожной, что власти приказали медсестрам ходить от двери к двери и делать жителям прививки{525}.
Доктор Роберт Даум, педиатр и специалист по инфекционным заболеваниям, работавший в нескольких больницах Чикагского университета, серьезно изучил эти всплески кори. Даум – настоящий идеал врача. У него глубокий голос, огромная борода и потрясающее чувство юмора. Незадолго до встречи со мной в Чикаго Даум вернулся с Гаити, где вместе с коллегами помогал преодолевать последствия землетрясения 2010 г.
Чикаго, в котором я прожил 13 лет, – это город пригородов. Зачастую пригороды бывают достаточно сегрегированы либо по расовому составу, либо по социально-экономическим признакам. Даум обнаружил, что население пригородов также различалось по отношению к прививкам. Небогатые афроамериканцы, жившие в районах типа Саус-Сайд, неохотно разрешали прививать своих детей вакциной MMR (против кори, свинки и краснухи). Непривитые дети вместе ходили в школу, вместе играли, кашляя и чихая друг на друга. Их поведение отвергало одно из предположений модели SAR о так называемом случайном смешивании, согласно которому любые два человека имеют одинаковый шанс вступить в контакт друг с другом. И понятно было, что эти дети как раз и явились распространителями кори.
Именно это явление неслучайного перемешивания и стало причиной «фиаско свиного гриппа» в 1976 г., когда ученые посчитали H1N1 угрозой национального масштаба на основании нескольких случаев заболевания в Форт-Дикс. Штамм свиного гриппа – известный в наши дни под названием A/New Jersey/76 – казался столь угрожающим отчасти потому, что быстро распространился по военной базе: в течение от двух до трех недель было диагностировано 230 подтвержденных случаев{526}. Это дало ученым основание предположить, что у болезни имеется крайне высокое репродуктивное число R0, близкое к 3, что было сопоставимо со значением R0 для пандемии «испанки» 1918 г.
Однако воинское подразделение можно считать средой, предрасположенной к заболеваниям. Солдаты находятся в нетипично тесном контакте друг с другом, в условиях, где им приходится делиться едой и постельными принадлежностями и сложно уединиться. Более того, они часто выполняют тяжелые физические упражнения, которые временно истощают иммунную систему, а социальные нормы в армии предполагают, что вы должны заниматься делом, даже если больны. Таким образом, для передачи инфекционного заболевания появляется множество возможностей, и оно начинает распространяться значительно быстрее.
Последующее изучение{527} событий в Форт-Дикс показало, что бурное распространение заболевания было вызвано этими особыми факторами, а не его вирулентностью. Форт-Дикс нельзя было считать аналогом какого-нибудь американского пригорода. Сам по себе штамм A/New Jersey/76 не был таким уж опасным. Значение R0 для него составляло всего 1,2, то есть было примерно таким же, как у обычного сезонного гриппа. Если бы дело происходило не на военной базе (или в другом месте с похожими условиями, типа тюрьмы или университетского общежития), то болезнь не распространилась бы так широко. В сущности, грипп в Форт-Дикс исчез сам по себе, после того как на базе не осталось инфицированных людей.
Фиаско, связанное с A/New Jersey/76, – как и парадокс в отношении ВИЧ/сифилиса в Сан-Франциско или всплески кори в Чикаго в 1980‑е гг. – способно многое сказать об ограничениях моделей, основанных на слишком упрощенных допущениях. Конечно же, я не хочу сказать, что вам всегда стоит предпочитать сложные модели простым; как мы уже видели в других главах этой книги, сложные модели так же успешно могут завести людей в тупик. А поскольку сложные модели часто дают нам более точные (хотя и не обязательно правильные) ответы, они способны слишком повысить самоуверенность исследователя и заставить его ошибочно считать себя отличным прогнозистом.
Тем не менее, хотя и можно считать плюсом модели ее простоту, она должна быть хотя бы изощренно простой{528}. Модели типа SIR, хотя и полезны для понимания болезни, слишком туповаты для того, чтобы помочь нам предсказать ее дальнейшее развитие.
Система имитационного моделирования Sim[99] в действии
Прогнозы погоды представляют собой один из немногих примеров сравнительно сложных моделей, в рамках которых качество предсказаний смогло значительно улучшиться. Для этого потребовались десятилетия работы, однако после создания системы, способной физически имитировать атмосферу, метеорологи получили возможность делать нечто большее, чем использовать исключительно статистические подходы к предсказаниям погоды.
Все больше и больше профессионалов пытается применять аналогичный подход к предсказанию развития болезней на основе агентного моделирования[100]. Я побывал в Питтсбургском университете и встретился с исследователями, находящимися на передовом крае разработки этой методики. Для названия своей модели команда использует аббревиатуру FRED, которая расшифровывается как «основа реконструкции динамики эпидемий» (framework for reconstruction of epidemic dynamics). Одновременно это имя является своеобразной данью уважения уроженцу Питтсбурга Фреду Роджерсу, бывшему ведущему детского телевизионного шоу «Mister Rogers’ Neighborhood».
Питтсбург, как и Чикаго, – это город, состоящий из пригородов. Размышляя о болезни, исследователи постоянно апеллируют к ним, и поэтому FRED представляет собой своеобразный аналог Питтсбурга – СимПиттсбург (SimPittsburgh) – невероятно детальную имитационную модель, в которой каждый человек представлен «агентом», имеющим семью, сеть социальных контактов, место жительства и набор убеждений и манер поведения, соответствующих его социально-экономическому статусу.