Рассмотрим простой пример того, как эти две области встречаются, так сказать, посередине и дополняют друг друга. Начнем с того факта, что статистические исследования показывают, что измерения самых разных физических величин и даже человеческих черт распределяются согласно кривой нормального распределения . Но на самом деле кривая нормального распределения – это не какая-то одна кривая, а целое семейство кривых, описываемых одной и той же общей функцией, и все они полностью характеризуются всего двумя математическими величинами. Первая из них – среднее значение – это центральное значение, относительно которого распределение симметрично. Эта величина зависит, разумеется, от того, какую именно переменную измеряют (рост, вес, IQ и так далее). Среднее значение одной и той же переменной может быть разным в разных популяциях. Например, средний рост шведов, скорее всего, отличается от среднего роста перуанцев. Вторая величина, определяющая кривую нормального распределения, называется стандартным отклонением . Это мера того, насколько тесно данные сосредоточены вокруг среднего значения. На рис. 36 у кривой нормального распределения (а) самое большое стандартное отклонение, поскольку значения рассеяны шире. Однако тут мы сталкиваемся с интересным фактом. Если с помощью интегрирования сосчитать площадь под кривой, легко математически доказать, что независимо от среднего значения и величины стандартного отклонения, 68,2 % измерений лежат в области, ограниченной одним стандартным отклонением по обе стороны от среднего значения (рис. 37). Иначе говоря, если среднее значение IQ в определенной (крупной) популяции равно 100, а стандартное отклонение равно 15, то 68,2 % людей в этой популяции обладают IQ между 85 и 115. Более того, для всех кривых нормального распределения 95,4 % всех случаев лежат в пределах двух стандартных отклонений от среднего, а 99,7 % данных попадают в пределы трех стандартных отклонений по обе стороны от среднего (рис. 37). Из этого следует, что в вышеприведенном примере 95,4 % популяции обладают IQ между 70 и 130, а 99,7 % – между 55 и 145.
Теперь предположим, что мы хотим предсказать, какова вероятность, что у случайно выбранного человека из этой популяции IQ окажется между 85 и 100. Рис. 37 подсказывает нам, что эта вероятность – 0,341 (или 34,1 %), поскольку по законам теории вероятности вероятность – это количество желаемых результатов, деленное на общее количество возможностей. А если нам интересно выяснить, какова вероятность, что кто-то (случайно выбранный) из этой популяции обладает IQ выше 130, то взгляд на рис. 37 покажет, что эта вероятность равна примерно 0,022, то есть 2,2 %. Примерно так же, опираясь на свойства нормального распределения и на метод интегрального исчисления (для вычисления площади под кривой), можно вычислить вероятность, что значение IQ попадет в тот или иной заданный диапазон. Иными словами, ответы нам дают теория вероятности и ее половинка-помощница статистика – в сочетании.
Как я уже не раз подчеркивал, вероятность и статистика обретают смысл, если имеешь дело с большим количеством событий, но не с отдельными событиями. Этой фундаментальной оговоркой, известной как закон больших чисел , мы обязаны Якобу Бернулли, который сформулировал ее в виде теоремы в своей книге « Ars Conjectandi » («Искусство предположений»; на рис. 38 приведен титульный лист) [95] Великолепный перевод на английский – Bernoulli 1713b.
. В переводе на обыденный язык теорема гласит, что если вероятность, что событие случится, равна p, то p – это самое вероятное соотношение количества случаев, когда это событие происходит, к общему числу попыток. Если же общее число попыток приближается к бесконечности, то доля успешных попыток становится в точности равна p . Вот как Бернулли формулирует закон больших чисел в «Искусстве предположений»: «Еще предстоит выяснить, увеличиваем ли мы при увеличении числа наблюдений и вероятность, что регистрируемое соотношение желаемых случаев к нежелательным приблизится к подлинному значению, и тогда эта вероятность в конце концов превзойдет всякую желаемую точность». Затем он пояснил это на конкретном примере [96] Приводится в Newman 1956.
.
Рис. 36
Рис. 37
Читать дальше
Конец ознакомительного отрывка
Купить книгу