зачем нужна теория вероятности
Для чего нужна теория вероятностей
Особенно широко теория вероятностей применяется для исследования природных явлений. Все протекающие в природе процессы, все физические явления в той или иной степени не обходятся без присутствия элемента случайности. Как бы точно не был поставлен опыт, как бы точно ни были бы зафиксированы результаты эмпирических исследований при повторном проведении эксперимента, результаты будут отличаться от вторичных данных.
При решении многих задач их исход зависит от большого количества факторов, которые сложно зарегистрировать или учесть, но они оказывают огромное значение на конечный результат. Порой количество этих второстепенных факторов так много, и они оказывают настолько большое влияние, что учесть их классическими методами просто невозможно. Так, например, это задачи на определение движения планет Солнечной системы, прогнозы погоды, длина прыжка спортсмена, вероятность встречи знакомого по пути на службу и различные ситуации на фондовой бирже.
Теория вероятностей применима в робототехнике. Например, некое автоматизированное устройство (первичная заготовка робота) выполняет определенные вычисления. В то время как она ведет расчеты, снаружи на нее систематически воздействуют различными помехами, незначительными для системы, но сказывающимися на результатах работы. Задача инженера состоит в том, чтобы определить, с какой частотой будет возникать ошибка, навязанная внешними помехами. Так же методами теории вероятности возможно разработать алгоритм для сведения погрешности вычисления к минимуму.
Задачи подобного рода очень часто встречаются в физике и при разработке новых видов техники. Они требуют тщательного изучения не только главных закономерностей объясняющих основные черты данных явлений в общих их понятиях, но и анализа случайных искажений и возмущений, связанных с действием второстепенных факторов, которые придают исходу опыта в заданных условиях тот самый элемент случайности (неопределенности).
Зачем нужна теория вероятностей в жизни
Именно под таким названием мы и провели вебинар — «Зачем нужна теория вероятностей в жизни».
В вебинаре мы не касались «жёлтых» тем типа «как выигрывать у казино» и «100% способ получить миллион без регистрации и SMS«.
Наоборот, были затронуты более серьёзные. Вот сам вебинар:
Идея похожего математического аппарата используется в Индии: можно купить билетик у мафии и кататься в общественном транспорте бесплатно, а полученные вами штрафы оплатит мафия. Называется «хафта» и выгодно вам и мафии, но не государству.
Подробно разбирается механизм лотереи — как идёт распределение средств и как происходит игра на эмоциях, когда одного победителя показывают по телевизору, а миллионы проигравших — нет. Эта идея была почерпнута из выступления на TED об ошибочных ожиданиях.
Также описывается открытие закона больших чисел и его применение сейчас.
А глядя на карту преступности страны, можно легко увидеть, что в одних регионах в 3 раза меньше шансов стать жертвой преступления, чем в других. Сам термин «уровень преступности» — статистический, это количественная характеристика преступности, и стоит отметить, что когда такой подход к оценке преступности был впервые представлен в 1832 во Франции, он вызвал смятение из-за стабильности полученных данных.
Ещё темы, затронутые в вебинаре:
Кстати, в анонсе вебинара использовался такой факт: в мае 2015 года Россия потеряла управление над космическим аппаратом «Прогресс». Как рассчитать, упадёт ли аппарат на сушу (или на конкретную страну). Сможете дать ответ? На наш взгляд, это отличный пример для иллюстрации геометрического подхода для расчёта вероятностей.
Поднять 100 долларов или пройти мимо? Теория вероятностей в повседневной работе
Удивительное дело, но мы чаще действуем полагаясь на интуицию, чем на здравый смысл и расчет. К сожалению, это касается не только личной жизни, но и работы. Помните старую историю о том, стоит ли Биллу Гейтсу подбирать бумажку в сто долларов из под ног? Шутники рассчитывали сколько зарабатывает Гейтс в минуту и утверждали, что поднимая бумажку он тратит свое время неэффективно.
Как вы считаете, стоило ему поднимать эти деньги? Не спешите с ответом. Пусть Гейтс зарабатывает в минуту 64 тысячи долларов. Это условное число. Нужно ли поднять бумажку в сто долларов? Подумайте.
И тут мы получаем, ловушку, которая заложена изначально в самой постановке вопроса. Гейтс не затрачивает свое личное время для того, чтобы приумножать состояние, это делают деньги на банковских счетах. Поэтому нагнувшись, Билл получит дополнительные сто долларов и это выигрышная ситуация для него. Чувствуете разницу в постановке вопроса? Я не беру в рассмотрение то, что эмоционально как и любой человек, он обрадуется тому, что нашел такую купюру. И это будет связано с тем, что найти сто долларов редкая удача и мало кто может похвастаться этим. Вы находили сто долларов? Только отвечайте честно. Если да, то что ощущали? Вероятность такого события крайне мала, отсюда высокая эмоциональная окраска.
Об автобусе и горилле на поле, шоу на ТВ и открытие двери с гоночным автомобилем, который можно забрать домой. Теория вероятностей в действии.
В нашей работе часты ситуации, когда надо принимать решение и мы сталкиваемся с двумя типами проблем. Недостаток информации. А также неверная интерпретация исходных условий, невнимательность к деталям. Второй тип проблем можно исправить тщательностью в подготовке. Давайте немного остановимся на таких проблемах.
Проблема №1. Неверная интерпретация исходных условий
В институте мы проводили математический тест на способность считать в уме. Вы можете потренироваться в нем, с вашими друзьями и знакомыми, он отнимет, буквально, несколько минут.
Как правило, начинают считать количество людей, просят вас повторять сколько человек вышло, сколько осталось. Но ваш вопрос звучит иначе, — «Сколько остановок проехал автобус?». Правильно на этот вопрос отвечают единицы, так как изначально ожидают типичного действия, а именно расчетов, так как тест на математику и вы об этом упоминали. Это типичный тест показывающий, что человек не уточняет исходные условия, не обращает внимания на детали и действует сообразно своему понимаю теста. Которое, как мы видим, оказывается неверным.
Когда будете проводить тест, не называйте никак остановки, это облегчает последующий подсчет, а также портит тест. Количество остановок должно быть довольно большим (более 10), а также вам стоит считать, чтобы не ошибиться с количество тех, кто вышел и зашел.
Другой вариант теста, стал уже классикой жанра, это горилла на баскетбольном поле. Испытуемых просят посчитать сколько пассов мяча делают игроки, в середине игры сквозь играющих проходит человек в костюме гориллы. Примерно половина тех, кто считал пасы, просто не замечает его. Они сосредоточились на другой задаче. И это особенность нашей психологии. Ниже пример видео из классического исследования.
В качестве вывода могу сказать следующее, очень важно правильно и тщательно оценить исходные условия. Что делать, а главное зачем. И уже потом действовать, но тут мы переходим к оценки вероятностей или пункту №2.
Проблема №2. Как сделать правильный выбор
У вас куча предложений о заключении новых договоров, вы не способны принять каждое из них. Какие-то выглядят интереснее, какие-то не так хороши. Встает в полный рост ситуация выбора в которой большинство из нас полагается на интуицию, но не здравый смысл и расчет. Вспомнить ситуации выбора из рабочих будней для каждого из нас не составит труда. Но как мы выбираем? Я полагаюсь в таких ситуациях на теорию вероятностей, которая и помогает принять окончательное решение. К сожалению, во многих высших учебных заведениях не преподают теорию вероятностей, либо делают это настолько плохо, что отбивают всякую охоту знать этот предмет. Однако теория вероятностей работает и помогает принимать решения. Позвольте заинтересовать вас этой теорией и побудить прочитать больше, только одним примером, который стал классическим.
Задача Монти Холла
В телевикторине участники должны выбрать одну из трех дверей. За одной дверью находится машина, за двумя другими нет ничего. Участник, выбирает дверь, а ведущий, которому известно, что находится за каждой из дверей, открывает одну из оставшихся, конечно пустышку. Затем он говорит участнику, — «Вы смените дверь или выберете другую?». Вопрос, который мы рассмотрим в том, выгодно ли участнику сменить дверь или выгодно оставить свой выбор.
Прежде, чем идти дальше, пожалуйста, подумайте и ответьте на этот вопрос. Оставляете дверь или меняете?
В 1990 году этот вопрос разделил Америку на два лагеря. С одной стороны была Мэрилин вос Савант, вошедшая в «книгу рекордов Гиннесса»как человек с самым высоким уровнем интеллекта равным 228. С другой стороны математики и читатели воскресной газеты, в которой Мэрилин высказала свою точку зрения на вопрос, менять или нет, дверь. Она получила несколько десятков тысяч отзывов, из которых более сотни были написаны дипломированными математиками, докторами наук. 92 процента написавших считали, что Мэрилин ошибается. Сделали свой выбор? Честно запишите его на бумажке, а потом поделитесь в комментариях, что вы выбрали. Заранее спасибо, за вашу честность.
Негодование большинства вызвала стратегия предложенная Мэрилин. Она предложила сменить дверь. Не оставить, а именно сменить, так как это повышает шансы на выигрыш.
Ответ на задачу Монти Холла
В задаче Монти Холла фигурирует три двери: за одной нечто ценное, скажем гоночная машина, за двумя другими — нечто гораздо менее интересное, например, русско-русский разговорник. Вы выбрали дверь №1. В таком случае пространство элементарных событий представлено следующими тремя возможными исходами:
Машина за дверью №1
Машина за дверью №2
Машина за дверью №3
Вероятность каждого исхода — 1 из 3. Поскольку предполагается, что большинство выберет машину, то первый исход будем считать выигрышным, а шансы угадать равны 1 из 3.
Далее по сценарию, ведущий, заведомо знающий, что находится за каждой из дверей, открывает одну дверь из не выбранных вами, и оказывается, что там лежит разговорник. Поскольку, открывая эту дверь ведущий использовал свое знание о предметах за дверями, чтобы не раскрыть местоположение машины, данный процесс нельзя назвать случайным в полном смысле этого слова. Существуют два варианта, которые стоит обдумать.
Первый — вы изначально делаете правильный выбор. Назовем такой случай «счастливой догадкой». Ведущий наугад откроет либо дверь 2, либо дверь 3, и если вы предпочтете сменить свою дверь, вместо шикарной, с ветерком поездки станете владельцем разговорника. В случае «счастливой догадки» лучше, конечно, не соблазняться предложением сменить дверь, однако вероятность выпадения «счастливой догадки» равна всего 1 из 3.
Второй — вы сразу же указываете не на ту дверь. Назовем такой случай «ошибочной догадкой». Шансы, что вы не угадаете, равны 2 из 3, так что «ошибочная догадка» в два раза вероятнее, чем «счастливая догадка». Как «ошибочная догадка» отличается от «счастливой догадки»? При «ошибочной догадке» машина находится за одной из тех дверей, которые вы обошли своим вниманием, а за другой — книжка. В противоположность «счастливой догадке» в этом варианте ведущий открывает невыбранную дверь не наугад. Поскольку он не собирается открывать дверь с машиной, он именно что выбирает ту самую дверь, за которой машины нет. Другими словами, в «ошибочной догадке» ведущий вмешивается в то, что до той поры называлось случайным процессом. Таким образом, процесс уже не может считаться случайным: ведущий пользуется своими знаниями, чтобы повлиять на результат, и тем самым отрицает само понятие случайности, гарантируя, что при смене двери участник получит авто. Из-за подобного вмешательства происходит следующее: вы оказываетесь в ситуации «ошибочной догадки», и, следовательно, выигрываете
при смене двери и проигрываете, если отказываетесь сменить ее.
В итоге получается: если вы оказываетесь в ситуации «счастливой догадки» (вероятность которой 1 из 3), вы выигрываете при условии, если остаетесь при своем выборе. Если вы оказываетесь в ситуации «ошибочной догадки» (вероятность 2 из 3), то под влиянием действий ведущего вы выигрываете при условии, если меняете первоначальный выбор. Итак, ваше решение, сводится к догадке, в какой ситуации вы окажетесь? Если вы чувствуете, что вашим изначальным выбором руководит шестое чувство, что вас направляет сама судьба, может, и не стоит менять свое решение. Но если вам не дано завязывать ложки узелками только силой мысли, то наверняка шансы того, что вы попали в ситуацию «ошибочной догадки», равны 2 к 1, так что лучше сменить дверь.
Статистика телепередачи подтверждает, что те, кто менял свой выбор, выигрывали в два раза чаще. Вуаля.
Надеюсь, что этот пример заставит вас задуматься, как быстро взять в руки книгу о теории вероятностей, а также начать ее применять в своей работе. Поверьте, это интересно и увлекательно, да и практический толк есть. Надеюсь пятничные размышления о психологии, предпосылках задач и теории вероятностей, не заставили вас скучать.
🎲 Зачем в науке о данных нужны теория вероятностей и статистика
С одной стороны, роль теории вероятностей и статистики в машинном обучении сравнительно невелика: используются лишь базовые понятия, хотя и довольно широко. С другой стороны, разведочный анализ данных, их очистка, подготовка и конструирование новых признаков – это чистая статистика. А поскольку эти операции в прикладной науке о данных (Data Science) занимают 90-95% времени, самый важный раздел математики для Data Scientist’ов – именно статистика. Кстати, это отлично демонстрирует разницу между машинным обучением и наукой о данных.
«Вероятности» классификации
Практически все модели классификации, используемые в машинном обучении, на самом деле выдают не единственную метку класса (или его номер), а набор «вероятностей» принадлежности к каждому классу. Логистическая регрессия с бинарной классификацией – это та же линейная регрессия, результат которой пропускается через функцию сигмоиды, преобразующую весь диапазон действительных чисел к диапазону [0,1].
Функции сигмоиды с разными параметрами
Число p, являющееся результатом сигмоиды, считается «вероятностью» принадлежности результата к одному из классов, а «вероятность» принадлежности к другому классу равна 1-p. Разумеется, это не настоящие вероятности – строго говоря, в данном случае вообще нет смысла говорить о вероятности, ведь результат классификации однозначен. Возможно, в данном случае было бы правильнее называть результат степенью уверенности: например, модель считает, что данный экземпляр принадлежит к классу 1 с уверенностью 74%. Тем не менее, принято называть этот показатель именно вероятностью.
Если классов больше двух, вместо сигмоиды используется Softmax – функция, преобразующая вектор вещественных чисел z размерности N в вектор неотрицательных чисел той же размерности, сумма которых равна 1 (sigma):
В результате мы получаем «вероятности» принадлежности к каждому классу, которые можно интерпретировать по-разному. Традиционно результатом классификации считается класс с максимальной «вероятностью», но ничто не мешает принять какие-то особые меры в тех случаях, когда модель «не уверена» в результате – например, если разница между двумя максимальными «вероятностями» невелика.
Если для классификации используется нейронная сеть, и классов больше двух, последним слоем этой сети практически всегда будет слой Softmax.
Все будет нормально
Нормальное распределение, или распределение Гаусса – это семейство функций плотности распределения вероятности с двумя параметрами: mu (среднее значение, оно же медиана и мода) и sigma (стандартное или среднеквадратическое отклонение). Иногда вместо sigma используется параметр sigma 2 – дисперсия нормального распределения:
График функции плотности нормального распределения похож на колокол. Его центральная координата равна mu, а стандартное отклонение sigma определяет уровень «крутизны» графика: чем оно меньше, чем большая доля значений переменной будет находиться недалеко от центра.
Функции плотности нормального распределения с разными параметрами
Центральная предельная теорема гласит, что сумма многих слабо зависимых друг от друга случайных величин имеет нормальное распределение – именно поэтому оно имеет огромное значение для статистики, которая обычно анализирует массовые явления. Например, если каждый человек, проходящий мимо кофейни, заходит выпить кофе с определенной вероятностью – то количество посетителей кафе будет иметь нормальное распределение.
Нормальное распределение настолько важно, что многие методы машинного обучения работают намного лучше, если данные нормально распределены (или даже вообще не работают в противном случае). Поэтому нормализация данных – очень часто выполняемая операция, а для нейронных сетей даже разработан слой пакетной нормализации (batch normalization).
Байесовские модели
Разведочный анализ данных
Разведочный анализ данных (exploratory data analysis, EDA) – это изучение данных для принятия решений по поводу их применения, очистки, преобразования и конструирования новых признаков. Как сказано выше, EDA – это чистая статистика, и основные цели его первого этапа – понять вид распределения признаков, основные параметры этого распределения, обнаружить выбросы и т.д.
В первую очередь для анализа данных обычно применяются гистограммы и «ящики с усами». Гистограмма просто разбивает весь диапазон данных на несколько отрезков, и для каждого отрезка выводит количество элементов набора данных, попадающих в этот отрезок. Легко заметить, что гистограмма отдаленно похожа на график функции плотности распределения вероятности, так что по ней очень легко определить, распределен ли признак нормально или имеет какое-то иное распределение. Обычно выводятся гистограммы сразу для нескольких признаков.
«Ящик с усами» не позволяет увидеть общую картину распределения, зато предоставляет ценную информацию о его параметрах, особенно квантилях. Квантиль – это такое значение признака, что заданный процент значений этого признака в наборе данных меньше этого квантиля. Например, квантиль 50% – это такое значение, что половина значений признака меньше, а вторая половина – больше него, этот квантиль называется медианой. Квантили 0%, 25%, 50%, 75% и 100% называются квартилями, поскольку они делят область определения признака на четыре части.
«Ящик с усами» и его параметры. Минимум и максимум не учитывают выбросы (на рисунке не показаны)
«Усы» выводятся без учета выбросов (outliers) – значений, больших Q3+1.5*IQR или меньших Q1-1.5*IQR. Принято считать, что выбросы скорее свидетельствуют об ошибках ввода данных, чем о реальных значениях признаков, и с ними надо что-то делать – например, удалить. На нашем рисунке выбросы не показаны, а в реальных «ящиках с усами» они выводятся в виде кружков за пределами «усов». Все понятия, о которых мы говорили, изучает статистика.
Анализ зависимостей между признаками
Для исследования возможных зависимостей между признаками используется множество методов, но самые простые из них – попарная диаграмма и матрица корреляции. Начнем с попарной диаграммы (pairplot). Выбираются несколько признаков, зависимости между которыми вы хотите исследовать, и получается комбинированная диаграмма, включающая небольшую диаграмму рассеяния (scatter plot) для каждой пары параметров. В диагональных клетках обычно выводятся графики или гистограммы соответствующих признаков.
Попарная диаграмма четырех признаков пингвинов (для трех разных видов, обозначенных цветами). Рисунок взят из документации по Seaborn.
Коэффициент корреляции между двумя признаками x и y по набору данных, состоящему из n записей, считается следующим образом («x с крышкой» и «y с крышкой» – средние значения x и y):
Матрица корреляции для набора данных о «Титанике».
Например, из матрицы корреляции для набора данных о «Титанике» легко увидеть, что какая-то положительная корреляция есть только между количеством родителей и количеством детей на борту: люди плыли либо парами/в одиночку, либо целыми семьями. Отрицательная корреляция есть между пассажирским классом и ценой проезда (естественно, билеты низших по номеру классов стоили дороже) и между полом и признаком выжившего: мужчины уступали места в шлюпках дамам.
Заключение
Как мы уже говорили, статистика занимает особое место в науке о данных, поскольку все данные собираются и обрабатываются именно методами статистики. Более того, иногда вся работа Data Scientist’а, включая создание и усовершенствование моделей, проводится только для того, чтобы доказать или опровергнуть какую-нибудь статистическую гипотезу! А это значит, что каждый Data Scientist обязан знать статистику на профессиональном уровне – по крайней мере, именно такие требования к ним предъявляют на Западе. Помимо статистики придется освоить основы математического анализа и линейной алгебры, о которых шла речь в первых публикациях нашего небольшого цикла.
Если вы хотите наработать необходимую для изучения Data Science математическую базу и подготовиться к углубленным занятиям в «Школе обработки данных» или Computer Science Center, обратите внимание на онлайн-курс «Библиотеки программиста». С помощью опытных преподавателей из ведущих вузов страны сделать это будет намного проще, чем самостоятельно по книгам.
Теория вероятности в обычной жизни: можно ли применить ее без погрешностей?
Теория вероятностей (тервер) – раздел математики, который изучает случайные события и их свойства. Ознакомиться с ней нужно, чтобы понимать, как принимать взвешенные решения. Ведь зная статистические данные и анализируя закономерности, можно «предсказать» исход события.
Я не станут грузить вас сложными формулами – желающие углубленно заняться тервером могут сделать это по книге В. Е. Гмурмана «Теория вероятностей и математическая статистика». В статье покажу простые примеры для понимания зависимых и независимых событий, расскажу о состоянии неопределенности и интуитивном знании.
Материал полезен широкому кругу читателей.
Коротко о теории вероятностей
Вероятность в зависимых событиях
Вы решаете отправить в подарок другу балык. Знаете номер дома, подъезд, этаж. Курьер просит называть номер квартиры. С мучительными усилиями вспоминаете, что в доме по три двери на площадку, но дальше – туман. Давайте рассчитаем, сможет ли курьер попасть в нужную квартиру с первого раза.
Имеем три варианта развития событий:
Но в истории участвует еще один человек: ваш друг. И событийность в его случае выглядит так:
Прежде чем пойти дальше, введем определение вероятности – количество благоприятных исходов к вероятному числу событий.
Таблица 1 – Девять исходов, три благоприятных
Представим, что курьер ошибся, и за дверью оказалась сногсшибательная блондинка в коротком халате. Для курьера исход положительный, для вас – нет. Поэтому считаем новую вероятность:
То же самое с другом:
Теперь у нас 4 варианта и 2 – выигрышные (таблица 2). Вероятность со второго раза попасть в квартиру друга – 1/2. Она уменьшилась из-за зависимости событий: мы уже исключили неблагоприятный исход и расчёт нужно производить заново. Если курьер настолько невезуч, что промахнется во второй раз, вероятность попасть по адресу в третий раз – 100%. Опытным путем мы проверили, что за двумя предыдущими дверьми балык никто не ждет.
Таблица 2 Четыре исхода, два благоприятных
Пример с курьером — начальный уровень тервера. Он применим для бытовых нужд: предугадать вероятность побочного эффекта от антибиотиков, выбрать из разнообразия бабушкиных пирожков пирожок с повидлом и др.
На экзамене по теории вероятности советский математик и автор учебника Елена Вентцель спросила:
— Кому все понятно? Поднимите руки.
В аудитории живо взметнулся лес рук.
— Отлично! Остальные свободны, оценка – пять баллов! Поднявшие руки – останьтесь. За годы преподавания я так и не поняла большей части тервера. Рада, что вы мне все сейчас объясните.
Байка с математического факультета
У вас есть свой блог? Зарабатывайте с нами от 10 000 рублей на партнерской программе TeachLine.
Вероятность в независимых событиях
Независимые события не влияют друг на друга: количество благоприятных исходов в каждом новом событии не меняется.
Регина Тодоренко и Леся Никитюк в рамках программы «Орел и Решка» приехали в США. Обе хотят провести уик-энд «по богатому» и кидают монетку. Леся поставила на орла, Регина – на решку. Вероятность уехать на собственном авто у девушек одинакова: 1/2. На это раз повезло Лесе. Впрочем, как в следующей поездке тоже.
Регина негодует, почему тервер работает не в ее сторону
Теперь определим, могут ли независимые события происходить подряд с одним и тем же исходом. Лесе везло уже два раза и выпадал «орел». Повезет ли в третий раз? Составим список возможных исходов:
По результату видно: вероятность определенной последовательности каждый раз меньше на вероятность одного события. То есть вероятность определенной последовательности – произведение вероятностей каждого события. Если в одном событии вероятность 1/2, то в трех: 1/2*1/2*1/2=1/8.
Как человек принимает решения в состоянии неопределённости
Часть мозга, которая ответственна за оценку ситуации связана с медиаторной системой — центром мотивационных и эмоциональных процессов. Логика и эмоции часто конфликтуют между собой, поэтому решение принимается случайным образом.
У моей подруги аллергия на виноград. Но в студенчестве она не могла отказаться от бокала вина на вечеринке. Часто ее дерзость оставалась безнаказанной и организм нормально воспринимал аллерген. Реже протестовал: у подруги появлялись отеки на лице и в горле. В эти моменты ее левое полушарие отчаянно искало закономерность и просчитывало вероятность наступления аллергической реакции, правое же шептало: «Не пей, лицо распухнет!». Она могла вывести количество благоприятных исходов математическим путем и пить вино без опасений, но эмоции оказались сильней. Подруга раз и навсегда отказалась от любых продуктов с виноградом.
Хороший пример принятия решений описан в книге Млодинова «(Не) совершенная случайность». Допустим, вы отправили рассказ в четыре издательства. От каждого получили отказ. На эмоциях вы придете к мысли: рассказ ужасный! Хотя, если изучить биографии популярных писателей, может оказаться, что дело не в вас. Отказы в публикации получали Стивен Кинг, Джоан Роулинг, Виктор Франкл. Такие истории случались вовсе не из-за отсутствия у них дара: просто в одном издательстве редактор не понял тонкую философию автора, в другом – спешил домой и проставил визу не читая.
Почему интуитивное знание всегда противоречит статистике
Моя бабушка считает: в Албании убивают на каждом шагу. Хотя в стране она не была и новостей о не слышала: ей так кажется интуитивно. Наверняка и вы не раз испытывали подобное чувство. Оно называется интуитивное знание – внутреннее убеждение, что собственная оценка более правдива, чем официальные источники и статистика.
Всего 127 убийств на 100 000 человек
Классическое исследование на тему интуитивного знания провели Даниэль Канеман и Амос Тверский. Они дали задание группе студентов: на основании портрета, оценить утверждения с таблицы как более (1 балл) и менее (8 баллов) вероятные (таблица 3).
Таблица 3
По портрету логично предположить, что Линда участвует в феминистском движении. Но студенты принимали решения интуитивно, что привело к ошибке. Вероятность, что Линда работает в банке и принимает участие в феминистском движении больше вероятности работы в банке.
Посмотрите на таблицу: вероятность работы в банке и увлечение феминистским движением – 4,1 балл. Но первое (работа в банке) и второе (феминистское движение) в сумме дают 8,3 балла. Согласно терверу, вероятность, что произойдут оба события не может быть выше, чем вероятность каждого события по отдельности. Главное утверждение (4,1 балла) содержит 2 события и является единым. В интуитивном решения правило тервера нарушено. Это доказывает — наши убеждения часто являются ложными.
В дальнейшем проводились множественные эксперименты, которые подтвердили догадку Канемана.
Вместо заключения
Теория вероятностей почти всегда разбивается о «случай», продиктованный убеждением или эмоцией отдельного человека. Поэтому использование ее в повседневной жизни может не оправдать ожиданий. Но выбирать вам! Хорошего дня!