парадокс монти холла разрушители мифов

Снова про Монти Холла или статистика как коллективная интуиция

На примере парадокса Монти Холла посмотрим, что общего между статистикой и интуицией, и как визуализация данных может помочь принять правильное решение, основанное на статистической оценке.
парадокс монти холла разрушители мифов. image loader. парадокс монти холла разрушители мифов фото. парадокс монти холла разрушители мифов-image loader. картинка парадокс монти холла разрушители мифов. картинка image loader.

Сложность парадокса Монти Холла

Парадокс Монти Холла получил свое название от ведущего телевизионного шоу «Let’s Make a Deal». Игровая ситуация:

Перед игроком три двери, за одной из которых приз. Игрок выбирает одну из них, не открывая. После этого ведущий, открывает одну из двух оставшихся дверей. Ведущий знает, за какой из дверей приз, и всегда открывает дверь, за которой приза нет. Далее игроку предлагается поменять первоначально выбранную дверь на другую, остающуюся закрытой. Вопрос: повышаются ли шансы игрока при изменении выбранной двери?

Парадокс заключается в том, что интуитивно кажется, что смена двери ничего не дает. Приз либо за одной дверью, либо за другой. Ситуация симметричная, и вероятности одинаковы. Однако, теория вероятностей показывает, что смена двери повышает шансы выигрыша в два раза.

Чтобы прийти к статистически правильному решению, игрок должен:

Первый шаг ключевой. Если остаться на уровне выбора дверей, то ничего не получится, ведь приз, так или иначе, за одной из двух дверей. А они выглядят одинаково — ситуация как будто симметричная. Можно не менять дверь и выиграть, можно поменять дверь и проиграть. Возможно, смена двери повышает шансы на успех, но не гарантирует его. Делая первый шаг, игрок не должен путать «повышение шансов» и «гарантированный выигрыш».

Второй шаг еще сложнее: построить и применить статистическую модель задачи. Цепочка рассуждений может быть такой.

Сначала игрок делает выбор одной из трех дверей. По условию приз размещен за любой из них с одинаковой вероятностью. На первом шаге вероятность выбора приза равна 1/3. На рисунке ниже изображено дерево решений после первоначального выбора игрока. Дверь, за которой приз, закрашена:

парадокс монти холла разрушители мифов. image loader. парадокс монти холла разрушители мифов фото. парадокс монти холла разрушители мифов-image loader. картинка парадокс монти холла разрушители мифов. картинка image loader.

Дальше ведущий открывает одну из дверей, не выбранных игроком. Игроку кажется, что ведущий выбирает дверь, которую открыть. Однако, это не всегда так. Поведение ведущего обусловлено первым выбором игрока:

Вероятность того, что приз за дверью, которую ведущий оставил закрытой, рассчитывается по формуле условной вероятности. И эти вероятности различаются для разных исходов, как показывает дерево решений. Закрытые двери, за которыми приз, закрашены:

парадокс монти холла разрушители мифов. image loader. парадокс монти холла разрушители мифов фото. парадокс монти холла разрушители мифов-image loader. картинка парадокс монти холла разрушители мифов. картинка image loader.

Игрок суммирует вероятности по каждой стратегии и получает их статистическую оценку. На рисунке видно, что вероятность выигрыша при смене двери (стратегия «switch») в два раза выше:

парадокс монти холла разрушители мифов. image loader. парадокс монти холла разрушители мифов фото. парадокс монти холла разрушители мифов-image loader. картинка парадокс монти холла разрушители мифов. картинка image loader.

После того, как стратегии оценены, игрок должен отказаться от первоначального выбора. Это сложно само по себе. Игрок будет стремится сохранить первоначальный выбор, так как это проще. Например, потенциальный покупатель гораздо вероятнее не будет отключать по умолчанию включенную услугу, нежели включит ее. В общем случае это приводит к систематическому отклонению поведения игроков от рационального.

Трудности применения статистического мышления

Проблемы, связанные с применением статистического мышления и рационального мышления вообще рассматриваются в книге Дэвида Канемана «Думай медленно, решай быстро». Исследования Канемана и его коллег показали, что человек склонен ошибаться в ситуациях, если нужно провести даже простые математические расчеты, не говоря уже об оценке вероятности.

Канеман вводит понятие двух систем. Система 1 это «быстрое», интуитивное, эвристическое мышление. Им человек пользуется, например, для определения настроения по выражению лица или при оценке дорожной ситуации, когда ведет автомобиль. Система 1 это автоматическая, почти мгновенная реакция, и работает в большинстве повседневных ситуаций.

Система 2 — «медленное», рациональное, математическое и статистическое мышление. Эта система подключается с усилием. Человек должен осознать, что автоматическое решение неправильное, задуматься и провести расчеты.

Ключевая проблема заключается в том, что в ситуации, где требуется подумать, человек полагается на автоматическое решение, предлагаемое системой 1. А эта система делает выводы, в первую очередь, на основании похожести вариантов. В парадоксе Монти Холла, после того, как ведущий открыл одну из дверей, две оставшихся выглядят одинаково, а обусловленное поведение ведущего старательно замаскировано. Ситуация представляется симметричной, а вероятности одинаковыми. Системе 1 не за что зацепиться, чтобы заметить вероятностную асимметрию. А системе 2 некогда подключиться. Тем более, что ведущий разными способами старается сбить игрока с толку.

Система 1 тренируется на многократном повторении ситуаций, доводя выбор до автоматизма (распознавание лиц, вождение автомобиля). Человек видит похожую ситуацию, что-то, что ему знакомо, и делает выбор, который ранее был успешен в аналогичных ситуациях.

Система 2 подразумевает, что человек начинает анализировать ситуацию, чтобы принять решение. В случае со статистическими задачами правильный ответ не очевиден. Чтобы к нему прийти, человек должен проанализировать данные, произвести расчеты и выбрать наибольшие значения статистических показателей.

Общее между интуицией и статистикой

Основная идея Дэвида Канемана в том, что система 1 (интуитивная) и система 2 (рациональная) различаются. В общем случае так и есть, однако, применительно к статистике между ними есть сходство.

Предположим, что все участники шоу Монти Холла собрались, чтобы обсудить результаты участия в шоу. Собравшиеся разбились на две группы: тех, кто остался с первоначально выбранной дверью и тех, кто поменял дверь. Согласно статистике, подсчет участников и их результатов покажет, что те участники, которые меняли дверь, выигрывали чаще. Если участников в обеих группах много, то доля победителей в группе сменивших дверь, будет примерно в два раза выше, чем в другой.

Достаточное количество участников, при котором будет видна статистическая закономерность, определяется законом больших чисел. Чем больше игроков примет участие в собрании, тем более результаты подсчетов их успехов и неудач будут соответствовать теоретическим. Другими словами, статистика начинает работать, когда игра была повторена разными участниками много раз. Если бы такое сообщество игроков существовало, то со временем они бы пришли к правильной стратегии.

Таким образом, в статистических расчетах система 2 опирается на закон больших чисел — достаточно большое (в идеале бесконечное) количество испытаний. Но и системе 1 большое количество испытаний позволяет принимать правильные решения. Многократное повторение доводит ту или иную способность человека до автоматизма.

Правила для двух систем:

Можно сказать, что расчет вероятности отражает коллективный опыт всех реальных и возможных участников игры Монти Холла. Для ситуаций индивидуального выбора стратегий статистика выступает как коллективная интуиция. Остается сделать статистику наглядной при помощи подходящей визуализации.

Диаграмма-шкала для визуализации теоретической и частотной вероятности

На примере парадокса Монти Холла мы смоделировали выбор человеком правильной стратегии с привлечением статистических расчетов. В общем случае:

Если поставить задачу помочь выиграть игроку, а не сбить его с толку, как на шоу, то в визуализации данных или пользовательском интерфейсе можно дополнить «двери», между которыми выбирает «игрок», диаграммами-шкалами. На такой диаграмме шкала задает градации изменения величины, и на шкалу накладывается столбик фактического значения по аналогии с термометром.

На диаграмме-шкале удобно совместить теоретическое, ожидаемое количество выигрышей (выделено серым) и фактическое после всех предыдущих игр (узкий черный столбик). Фактическое значение меняется после каждого принятого решения по выбору одной из двух стратегий и сохраняется на протяжении всей серии игр:

парадокс монти холла разрушители мифов. image loader. парадокс монти холла разрушители мифов фото. парадокс монти холла разрушители мифов-image loader. картинка парадокс монти холла разрушители мифов. картинка image loader.

Таким образом, подходящая визуализация статистических данных помогает человеку выбрать правильную стратегию. Например, в интерфейсе, похожем на прототип, элемент интерфейса, соответствующий стратегии, может быть помечен статистическим виджетом, похожим на диаграмму-шкалу. Изображение фактических данных полезно, если пользователь выбирает между примерно одинаково успешными стратегиями. Оно позволяет ему быстро прийти к заключению:

Источник

Парадокс Монти Холла

парадокс монти холла разрушители мифов. 1635774717339671385. парадокс монти холла разрушители мифов фото. парадокс монти холла разрушители мифов-1635774717339671385. картинка парадокс монти холла разрушители мифов. картинка 1635774717339671385.

Неразумная обезьяна (4)

Продолжаем знакомиться с книгой Дэвида Роберта Граймса «Неразумная обезьяна. Почему мы верим в дезинформацию, теорию заговоров и пропаганду.»

Ссылки на предыдущие части: 1 2 3

Автор начинает с излюбленного рассказа западных аналитиков: условных вероятностей или теоремы Байеса. Для затравки: представьте себе, что вы играете в «Поле чудес» и выпал сектор приз. Якубович вытаскивает не две, а три шкатулки, в одной из них ключи от машины. Вы выбираете одну из шкатулок, и говорите ему, что выбираете её. Тогда Якубович открывает одну из двух оставшихся, и та оказывается пуста. И предлагает вам хорошенько подумать и, может быть, изменить свой выбор. Стоит ли так делать? И действительно: если вы измените свой выбор, то угадаете с вероятностью 2/3. Этот парадокс носит имя Монти Холла.

Всё это кажется праздными рассуждениями, если бы статистическая неграмотность не служила причинами трагедий. Вот, например, так называемая ошибка прокурора. Есть такое заболевание – синдром внезапной детской смертности. Младенец перестаёт дышать и умирает в колыбели. Оно довольно редкое – один случай на 8543 ребёнка. Какова вероятность, что оба ребёнка в семье умрут этой смертью? Один случай на 8543 в квадрате, или 73 миллиона? Так думал выдающийся педиатр Рой Мидоу. В результате безутешная мать, дочь офицера полиции, получила срок за умышленное убийство своих детей. На счастье, нашлись добрые и бескорыстные люди, которые доказали, что эти два случая были связаны генетической предрасположенностью или экологией. Салли Кларк была оправдана после трёх лет за решёткой. Но окончательно она уже никогда не оправится.

Интерпретация статистики – ещё один подводный камень для тех, кто принимает решения. Самая распространённая ошибка – когда из корреляции, то есть совпадения трендов, выводится причинность. Её совершали средневековые врачи, которые считали, что люди заболевали не из-за бактерий, а из-за плохого воздуха. Именно желание избавиться от зловония, мыслимого причиной болезней, побудило строить канализацию в Лондоне. И оно помогло! Холера отступила. Но не ушла, ведь Лондон – большой, и нельзя всё разом поменять. Была новая вспышка, и один из скептиков, которого звали Джон Сноу, нашёл, что болезнь распространялась не вонью (хотя и той хватало), а одной из водозаборных колонок. Колонку закрыли, холера ушла. Местные власти обиделись на такое «самоуправство» и восстановили колонку. Холера вернулась. Вот так проявила себя инерция мышления. Пройдёт ещё семь лет, прежде чем, как Пастер откроет инфекционную теорию.

Автор советует читателю не вестись на заголовки с шокирующей статистикой. Очень часто это лишь желание издания хайпануть. Они могут написать, скажем, о высоком относительном риске получить рак кишечника у мясоедов. Тогда как в абсолютном смысле этот риск составляет всего порядка процента. Обращать внимание нужно и на значимость результата, чтобы не быть введённым в заблуждение шумом или случаем. Альтернативные медики любят, например, проводить исследования на с тысячами, а с десятками пациентов, да ещё порой без плацебо. И получают неплохие цифры. Верить которым нельзя, потому что это по большому счёту мухлёж.

Конечно, недобросовестно проведённые исследования – бич не только альтернативной медицины. Малый объём данных, низкий эффект, существование других трактовок, вольные определения и методы, спонсорство, горячая тема исследования – всё это тревожные звоночки. В этом случае нужно задуматься. Таких случаев относительно мало в физике. Но медицина и биология – далеко не свободны от таких неаккуратных исследований.

Почему сами учёные страдают такой неаккуратностью? Ну, далеко не все из них – асы статистики. Далее: не получишь результат – не опубликуют. Да и новых грантов не жди. Вот и растёт число «мусорных» публикаций. Если по уму – так надо публиковать и неудачи. Отрицательный результат, ведь он тоже результат. Впрочем, метаанализ тоже может помочь нам отличить зёрна от плевел.

Не надо бояться чисел. Надо учиться искать противоречия и задавать дополнительные вопросы. Например, просить пересчитать проценты в абсолютные числа. И мухлёж вылезет наружу. Не сегодня, так завтра. Дерзайте, дорогу осилит идущий!

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *