6. Стратификация данных
7. Диаграмма Парето (80/20)
8. Схема Исикава
9. Диаграмма рассеяния
В РАД мы включаем семь простых методов контроля качества [Куме 1990], семь новых методов контроля качества [Адлер 2000, Кане 2008], визуализацию данных, метод построения диаграмм (блок-схем) потока процессов (flowcharts), ящик с усами, правило семи вопросов, ментальные карты и любые другие полезные для понимания картинки. Поскольку все перечисленные методы нужны не только при контроле качества, а при анализе любых данных в любых сферах деятельности, мы далее опускаем слова «контроль качества» и говорим о семи простых и семи новых методах РАД, включив в семь простых диаграммы потока и визуализацию как самостоятельный метод (т. е. по сути семь простых у нас состоят из девяти инструментов) [2] Термины «семь простых» и «семь новых» настолько широко вошли в уже имеющуюся литературу, что мы не видим смысла их менять.
.
Семь новых методов РАД
Диаграмма сродства
Граф связей
Метод иерархических структур
Матричная диаграмма (домик)
Анализ матричных диаграмм
Блок-схема принятия решений
Сетевой график (метод ПЕРТ)
Один из самых простых способов превратить данные в информацию – добавить к ним ответы на семь простых вопросов: кто? когда? как? где? зачем их собирал? сколько чего собрали? и что, собственно, они означают?
В англоязычной литературе это хорошо известное и очень популярное, особенно у японцев,
Правило 5W+2H:
Но вербальных ответов недостаточно – они по-прежнему не позволяют нам обнаружить структуры и тренды (если, конечно, они есть – а они есть в большинстве случаев реальной жизни). Чтобы обнаружить структуры и тренды в данных, их – данные – нужно визуализировать.
Наиболее употребительные практические инструменты визуализации данных перечислены в табл. 1.1.
Бóльшая часть того, что перечислено в этой таблице, будет рассмотрена в разных местах книги, но сначала разберем несколько примеров того, как визуализация помогает нам обнаружить то, что нельзя увидеть из цифр. В табл. 1.2 приведена часть таблицы Росстата с данными о валовом внутреннем продукте (ВВП) РФ в постоянных ценах 2011 г. (вся таблица просто не поместится на одной странице). Значения ВВП приведены в миллиардах рублей. Данные даны поквартально, но из таблицы вряд ли вы увидите какие-то закономерности.
На рис. 1.2 показан ход ВВП во времени с 1995 по 2016 г. в постоянных ценах 2008 г. Из рисунка видно, что рост ВВП начался сразу после дефолта 1998 г. и дальше до 2007 г. шел с практически идентичной структурой данных, что говорит о постоянстве системы, т. е. рост ВВП на этом участке был обусловлен восстановлением экономики после дефолта. В 2008 г. произошел обвал вследствие мирового экономического кризиса, после чего снова начался рост, прекратившийся примерно в 2012 г. После этого экономика не растет, т. е. имеет место так называемая стагнация экономики страны. Все вышесказанное очевидно любому человеку, и для этого не нужно ничего считать, так же как и не нужно никаких специальных экономических знаний. Нам все рассказала простая картинка, на которой показан ход процесса во времени. Такая картинка получила название «карта хода процесса». Англоязычный аналог этого термина – run chart.
Глава 2
История возникновения статистического мышления. Основы теории вариабельности
Мышление – это то, чем каждый из нас, слава богу, обладает от рождения. И пока что оно нас не подводит. Но что такое «статистическое мышление»? И зачем оно нам нужно (если нужно)? Такие вопросы могут возникнуть у читателя после знакомства с названием этого параграфа. Простых ответов на подобные вопросы нам дать не удастся. Поэтому вам придется довольствоваться сложными разъяснениями. Но прежде, чем мы попытаемся их дать, заметим, что сам термин «статистическое мышление» представляется не совсем удачным. Дело в том, что слово «статистический» у многих людей вызывает неприятие, поскольку напоминает об изучавшейся когда-то в институте дисциплине под названием «математическая статистика», которую большинство людей не помнит и побаивается.
Читать дальше