Сигнал и шум. Почему одни прогнозы сбываются, а другие – нет - Нейт Сильвер
Шрифт:
Интервал:
Закладка:
Рис. 7.3. Аутизм: освещение в СМИ и количество поставленных диагнозов, 1992–008 гг.
Озонофф полагает, что именно это явление может отвечать за ту скорость, с которой свиной грипп распространился по США в 2009 г. Хотя болезнь и распространялась достаточно быстро, резкий статистический прирост мог быть отчасти связан с тем, что люди сообщали врачам о симптомах, которые прежде игнорировали.
Если бы доктора решили производить расчеты темпа распространения болезни среди населения, то количество официально объявленных случаев привело бы к искаженной статистике. Чем-то это напоминает ситуацию со статистикой преступности. Предположим, что полиция сообщает об увеличении количества ограблений в каком-то районе. Связано ли это с тем, что полицейские усилили бдительность и стали раскрывать больше преступлений, чем раньше, или же им стало проще сообщать об этом?[95] А может быть, этот район действительно стал более опасным? Подобные проблемы очень сложны для любого, кто хочет делать прогнозы заболеваемости гриппом на ранних стадиях.
Самоотменяющиеся предсказания
Самоотменяющееся предсказание относится к противоположным случаям, при которых факт появления предсказания приводит к прекращению развития ситуации. Интересным примером здесь могут служить системы GPS-навигации, обретающие все бо́льшую популярность. Через Манхэттен проходят две основные трассы в направлении с юга на север – Вест-Сайдское шоссе, идущее вдоль реки Гудзон, и скоростная магистраль ФДР-Драйв на восточной стороне острова. В зависимости от конечной точки водитель не всегда может отдать предпочтение определенной трассе. Однако его GPS-система сама укажет, по какой дороге ехать, учитывая степень их загруженности: система, по сути, предсказывает, какой путь выбрать, чтобы быстрее добраться до точки назначения. Проблема возникает, когда много водителей пользуется одной и той же системой: совершенно внезапно дорога становится перегруженной машинами, и прежде «более быстрая» трасса превращается в более медленную. Уже есть ряд теоретических{512} и эмпирических{513} свидетельств того, что это стало проблемой на некоторых часто используемых трассах в Нью-Йорке, Бостоне и Лондоне и что такие системы иногда могут оказаться контрпродуктивными.
Это качество предсказаний порой может представлять проблему и с точки зрения правильности предсказаний, касающихся гриппа, поскольку их цель, хотя бы отчасти, состоит в повышении общей осведомленности о болезни и, таким образом, изменения поведения в обществе. Самым эффективным прогнозом в отношении гриппа может считаться тот, которому не удается сбыться, поскольку он мотивирует людей на более здоровый выбор.
Простота без изощренности
Финский ученый Ханна Кокко предпочитает использовать статистическую или прогнозную модель рисования карт{514}. Модель должна содержать достаточно деталей, чтобы быть полезной и честно отображать фундаментальную картину: наверняка вы не захотите упустить из внимания крупные города, рельефные реки, высокие горные массивы и главные дороги.
Однако чрезмерное количество деталей иногда может запутать путешественника, а порой и сбить его с пути. Как было отмечено в главе 5, эти проблемы носят не только эстетический характер.
Без необходимости усложненные модели способны оставить в системе больше шумов, чем сигналов, и в результате плохо воспроизводят лежащую в основе структуру, тем самым ухудшая качество прогнозов.
Но какой объем деталей считать недостаточным или, напротив, чрезмерным? Чтобы изучить картографию и научиться сочетать элементы искусства и науки, присущие ей, может уйти целая жизнь. Возможно, говорить о выстраивании модели как о форме искусства – это уже чересчур, но что-то правильное в идее есть.
Однако в идеале на вопросы, подобные тому, что задала Кокко, можно дать эмпирический ответ. Работает ли модель? Если нет, то, возможно, нам стоит изучить ее с другой степенью детализации. В эпидемиологии традиционные модели, используемые докторами, довольно просты – и не работают так, как хотелось бы.
Самое базовое математическое описание инфекционного заболевания называется SIR-моделью (рис. 7.4). В этой модели, сформулированной в 1927 г.{515}, принято следующее допущение: существуют три «состояния», в одном из которых любой человек может находиться в каждый момент времени. S (susceptible) означает восприимчивые к болезни, I (infectiousill) – заразившиеся, a R (recovery) – выздоровевшие после болезни. В рамках этой модели переход от одного состояния к другому происходит всегда в одном направлении – от S к I и затем к R. Вакцинация выступает своего рода «короткой дорожкой»[96], позволяющей человеку перейти от S к R без перенесения заболевания. Математика этой модели сравнительно проста и сводится к ряду дифференциальных уравнений, которые можно решить на ноутбуке за несколько секунд.
Рис. 7.4. Схематическое изображение SIR-модели
Проблема состоит в том, что для нормальной работы модели требуется сделать множество предположений, и некоторые из них на практике выглядят не вполне реалистично. В частности, в модели заложено предположение, что все участники той или иной популяции ведут себя одинаковым образом: то есть они в равной степени подвержены болезням, имеют одинаковый доступ к вакцинации и пересекаются друг с другом случайным образом. Нет никаких различий с точки зрения расы, пола, возраста, религии или сексуальной ориентации, и все ведут себя более-менее одинаково.
Парадокс ВИЧ в Сан-Франциско
Увидеть недостатки этих допущений проще всего при изучении болезней, передающихся половым путем. В конце 1990‑х и начале 2000‑х гг. был заметен сильный рост незащищенного секса в гомосексуальном сообществе Сан-Франциско{516}, опустошенном пандемией ВИЧ/СПИД двумя десятилетиями ранее. Некоторые исследователи видели причину этого в увеличении темпов потребления наркотиков, особенно кристального метамфетамина, который наиболее часто вызывает более рискованное сексуальное поведение. Другие обращали внимание на повышение эффективности антиретровирусной терапии – коктейлей из различных лекарственных средств, способных продлить жизнь ВИЧ-инфицированных пациентов на многие годы или десятилетия. В результате геи перестали воспринимать диагноз ВИЧ как смертельный приговор. Другие теории концентрировались на поколенческих закономерностях – молодое поколение геев начало воспринимать Сан-Франциско 1980‑х гг. с его эпидемией СПИДа как древнюю историю{517}.
Единственное заключение, с которым соглашались эксперты, состояло в том, что при увеличении случаев незащищенного секса должно было увеличиться и количество случаев заражения ВИЧ{518}. Однако этого не случилось, хотя наблюдался рост других заболеваний, передающихся половым путем. В частности, наблюдался всплеск (с девяти случаев в 1998 г. до 502 в 2004 г.{519}) количества вновь поставленных диагнозов «сифилис» среди мужчин, занимавшихся сексом с другими мужчинами (MSM){520}, притом что в 90‑е гг. эти болезни почти исчезли в Сан-Франциско. Выросло и количество заболеваний гонореей. Однако, как ни парадоксально, количество новых случаев ВИЧ не увеличилось. В 2004 г., когда заболеваемость сифилисом достигла самого высокого уровня за многие годы наблюдений, количество диагнозов ВИЧ упало до минимального значения с начала эпидемии СПИДа (рис. 7.5). С точки зрения исследователей, это казалось очень странным: сифилис и ВИЧ в обычных условиях обладают достаточно высокой статистической корреляцией. Кроме этого, между ними имеется причинно-следственная связь, поскольку наличие одной болезни может сделать вас более уязвимым к приобретению второй{521}.
Рис. 7.5. Изменение количества вновь поставленных диагнозов ВИЧ и сифилиса, геи, Сан-Франциско, 1998–004 гг.
Как оказалось, решение парадокса заключалось в том, что геи начали активнее использовать так называемый серосортинг, иными словами, они выбирали половых партнеров с тем же статусом ВИЧ, что и у них. Не до конца понятно, как им удавалось это организовать, однако этот факт был задокументирован детальными поведенческими исследованиями, проведенными в Сан-Франциско{522}, Сиднее{523}, Лондоне и других городах с большими популяциями геев. Возможно, что положительную роль сыграли и кампании в области здравоохранения – часть из них переключилась с идеи борьбы с «усталостью от презервативов» на «обсуждаемую безопасность». Также не исключено и влияние интернета, заменившего бары в качестве лучшего места для поиска половых партнеров. В интернете существуют другие нормы по разглашению информации: многие мужчины указывают в профилях на специализированных сайтах свой статус ВИЧ, а кроме того, в интернете проще задавать интимные вопросы (и получать честные ответы), чем на танцполе{524}.