О средних величинах и медианах
Хотя средние величины часто упоминаются в самых разных повседневных контекстах, мне кажется, что «среднее» – это одна из самых запутанных проблем в мире статистики. Например, нам скажут, что средняя месячная зарплата в условном Хэппиленде – стране счастливой жизни – составляет $100 000. Что это значит? Я спросил нескольких умных людей, и оказалось, что многие понимают это так: примерно у 50 % жителей Хэппиленда доход превышает $100 000, а у другой половины он ниже этой отметки. Конечно же это ошибка. Величина, разделяющая население надвое, – это не среднее, а медиана . Что же до средней величины, о которой упоминалось выше, то очень вероятно, что в стране есть горстка избранных с баснословными доходами, гораздо выше уровня $100 000, а все остальные – большинство – зарабатывают меньше. Представим такую картинку: семеро работают в гипотетическом филиале банка. У шестерых обычные зарплаты, а у менеджера – $7 млн. Выходит, средняя зарплата по банку – более $1 млн. Да, как-то так – ведь даже если мы возьмем одну только зарплату менеджера и разделим ее на семь равных частей, у нас в каждой части будет по миллиону, значит, реальная средняя величина должна быть выше. В этом примере только один человек получает больше остальных, а все остальные получают меньше, и, как видно, доходы меньше средней зарплаты не у половины сотрудников, а у гораздо большего их числа. Известен тот факт, что в некоторых странах только у 30–40 % работников заработная плата больше средней.
Со средней величиной есть проблема: она очень чувствительна к крайним значениям. Если наш менеджер удвоит даже только свою зарплату – и никто другой при этом не получит ни гроша, – средняя зарплата равно так же практически удвоится. Впрочем, медиана (не забывайте, что медиана – это «срединная» величина в перечне чисел, выстроенном от самого малого к самому большому) создает противоположную проблему. Такое же повышение зарплаты менеджера не окажет на медиану никакого влияния: она совершенно нечувствительна к крайним значениям. И если мы хотим показать ситуацию в численно обоснованном виде, то должны представить и медиану, и среднюю величину, а также стандартное отклонение и форму распределения. Любопытно: когда данные о зарплате появляются в новостях, почти всегда сообщают о «средней зарплате» или о «средних расходах среднестатистической семьи» (надеюсь, теперь вы понимаете причину). Безусловно, редакторы новостей чувствуют, что им не следует углубляться в статистические сложности: это разве что заставит зрителей переключить канал. Но вы, мои любезные читатели, не должны делать никаких умозаключений на основе этих данных. Ясно, что статистик, стоя одной ногой в ледяной воде, а другой – в кипятке, блаженствует (в среднем).
Среднестатистический казначей
Как-то раз я слышал репортаж о министре финансов некоей страны, который, судя по его цитируемой фразе, надеялся, что наступит день, когда все рабочие в его стране начнут зарабатывать больше, чем в среднем по стране (иногда автором этой «мудрости» называют Билла Клинтона). Должен признать, это блестящая идея. Можем только пожелать этому казначею долгих лет жизни – она ему понадобится, если он намерен дождаться дня исполнения своей мечты. В ответ на этот рассказ один из читателей предположил, будто казначей не в курсе, что такое средняя величина, и любезно объяснил: «50 % работников зарабатывают больше среднего, а 50 % – меньше». Само собой, он тоже не особенно разбирался в статистике – и спутал среднюю величину с медианой.
Среднестатистические водители
В другой раз я читал статью, автор которой, журналист, в статистике вроде как должен был разбираться по долгу службы. Он утверждал, будто каждый считает, что водит «лучше среднего», и объяснял, что такая ситуация математически невозможна. Он был неправ. И объяснить почему – очень просто. Скажем, пусть четверо из пяти водителей за последний год попали в аварию по разу, а пятый – 16 раз. Выходит, в общем все пятеро водителей попадали в аварии 20 раз, и средняя величина аварий на каждого водителя – 4. Получается, четверо из пяти (то есть 80 %) водят лучше среднего! В следующий раз, когда прочтете, что все считают себя водителями лучше среднего, не отвергайте это утверждение так быстро. Кто знает? Возможно, они правы – по крайней мере, статистически.
Говори за себя
Один из самых странных и самых интересных фактов о статистике заключается в том, что многие люди, никогда ее не изучавшие, верят в то, что они ее понимают (покажите мне человека, который никогда не изучал дифференциальные уравнения в частных производных или функциональный анализ – и тем не менее уверяет, будто знает эти дисциплины). Люди часто бросают в разговоре реплики вроде: «Числа говорят сами за себя». Это глупо. Я никогда не слышал, чтобы число 7 говорило за себя или вело задушевные беседы с числом 3. А вы?
Читать дальше
Конец ознакомительного отрывка
Купить книгу