Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Здесь есть возможность читать онлайн «Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры» — ознакомительный отрывок электронной книги совершенно бесплатно, а после прочтения отрывка купить полную версию. В некоторых случаях можно слушать аудио, скачать через торрент в формате fb2 и присутствует краткое содержание. Город: Москва, Год выпуска: 2016, ISBN: 2016, Издательство: АСТ, Жанр: Базы данных, foreign_comp, foreign_edu, Прочая научная литература, на русском языке. Описание произведения, (предисловие) а так же отзывы посетителей доступны на портале библиотеки ЛибКат.

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры: краткое содержание, описание и аннотация

Предлагаем к чтению аннотацию, описание, краткое содержание или предисловие (зависит от того, что написал сам автор книги «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры»). Если вы не нашли необходимую информацию о книге — напишите в комментариях, мы постараемся отыскать её.

Насколько велики на самом деле «большие данные» – огромные массивы информации, о которых так много говорят в последнее время? Вот наглядный пример: если выписать в линейку все цифры 0 и 1, из которых состоит один терабайт информации (вполне обычная емкость для современного жесткого диска), то цепочка цифр окажется в 50 раз длиннее, чем расстояние от Земли до Сатурна! И тем не менее, на «большие данные» вполне можно взглянуть в человеческом измерении. Эрец Эйден и Жан-Батист Мишель – лингвисты и компьютерные гении, создатели сервиса Google Ngram Viewer и термина «культуромика», показывают, каким образом анализ «больших данных» помогает исследовать трудные проблемы языка, культуры и истории.

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры — читать онлайн ознакомительный отрывок

Ниже представлен текст книги, разбитый по страницам. Система сохранения места последней прочитанной страницы, позволяет с удобством читать онлайн бесплатно книгу «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры», без необходимости каждый раз заново искать на чём Вы остановились. Поставьте закладку, и сможете в любой момент перейти на страницу, на которой закончили чтение.

Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Но давайте будем реалистами. Кэрол Гиллиган знаменита не больше, чем Роберт Рэдфорд. О ней больше говорят в книгах, поскольку она представляет тип личности, интересный для создателей книг, – научная знаменитость и социальный критик. Однако она совсем не тот человек, события из жизни которого могли бы ежедневно освещаться в прессе. Ее портрет вряд ли будет висеть на рекламных щитах, и перед ней вряд ли будут преклоняться девочки-подростки.

Проблема состоит в том, что «флава» не отражает более масштабную картину. Если бы мы приняли во внимание упоминания в выпусках телевизионных новостей, рассказы в таблоидах и на интернет-сайтах, посвященных знаменитостям, или беседы в офисах во время перекуров, то было бы очевидно, что Гавел и Рэдфорд смогут затмить Гиллиган, причем с большим перевесом. Гиллиган занимает лидирующие позиции благодаря тому, что статистики называют ошибкой выборки, – аспект культуры, который мы измеряем с помощью «флавы», дает ей несправедливое преимущество. Это не подлинная слава.

Наша аэродинамическая труба не лишена своих недостатков. Однако они не уникальны. Они вполне вписываются в классическую ошибку, присущую любым измерительным инструментам, с которой ученые и статистики имели дело в течение десятилетий. Помня об этом несовершенстве, мы наверняка сможем разработать более качественные инструменты в будущем.

Связь между «флавой» и подлинной славой отлично иллюстрирует наш общий подход. Привычное для повседневной жизни понятие славы слишком сложно и слишком неточно, чтобы подчиняться количественному анализу. Поэтому мы ищем что-то, что можем измерить (например, «флаву»), и стараемся оставаться максимально близко к изначальной концепции. Результатом становится компромисс – мы создаем своего рода имитатора знаменитости, которого используем в роли подопытного кролика и подвергаем тщательно продуманным экспериментам. Как только в нашем распоряжении появятся более обширные массивы данных, включающие информацию из таблоидов, журналов и научных статей, измеряемая нами «флава» станет уже ненужной и вместо нее будут использоваться более изощренные альтернативы. Аэродинамическая труба Райтов не выдерживает никакого сравнения с турбинами LenSx, создающими поток ветра со скоростью 30 М для тестирования новых космических аппаратов.

Но пока что «флава» вполне подходит для наших целей. И теперь для упрощения давайте больше не будем говорить об этом различии, а станем просто использовать в дальнейшем рассказе слово «слава», ведь «почти знаменитый» – это «достаточно знаменитый».

Итак, что же мы, вооружившиеся новой аэродинамической трубой, можем узнать об аэродинамике взлета личности и механике приземления обратно?

Слава как болезнь

Начав изучать славу с помощью данных n -грамов, мы быстро поняли, что каждая история отличалась от других. Мы попытались найти общие закономерности, однако результаты оказывались довольно противоречивыми и не поддающимися объяснению. По сути, мы просто застряли в бездонной яме с данными.

Чтобы понять, почему это произошло, нам нужно совершить путешествие во времени в 1930 год и попасть в небольшой норвежский городок под названием Кристиансанн. Живший там доктор по имени Кристиан Андворд пытался победить эпидемию, преследовавшую его пациентов и всю страну в целом. Андворд изучал туберкулез, от которого Норвегия страдала в невиданных для наших дней масштабах. К примеру, в норвежском городе Тронхейм более 1% детей, родившихся между 1887 и 1891 годами, умерло от туберкулеза на первом же году жизни. Туберкулез стал причиной смерти половины детей в возрасте между 11 и 15 годами.

При этом стала заметной довольно примечательная тенденция. От десятилетия к десятилетию средний возраст жертв туберкулеза в Норвегии увеличивался. В чем же была причина?

У Андворда (или, по другой версии, у работавшей с ним медсестры) возникла идея. Вместо того чтобы изучать протекание болезни по всей совокупности населения, он разбил его на «когорты», то есть группы людей, родившихся примерно в одно время [125]. Преимущество этого подхода состояло в том, что, учитывая год рождения, Андворду легче было отсекать различные вводящие в заблуждение факторы, такие как голод, от которого могло страдать лишь одно поколение детей. Основной недостаток этого подхода состоял в том, что он требовал значительно большего объема данных, чем те, которые можно было собрать в небольшом городке Кристиансанн.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Похожие книги на «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры»

Представляем Вашему вниманию похожие книги на «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры» списком для выбора. Мы отобрали схожую по названию и смыслу литературу в надежде предоставить читателям больше вариантов отыскать новые, интересные, ещё непрочитанные произведения.


Отзывы о книге «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры»

Обсуждение, отзывы о книге «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры» и просто собственные мнения читателей. Оставьте ваши комментарии, напишите, что Вы думаете о произведении, его смысле или главных героях. Укажите что конкретно понравилось, а что нет, и почему Вы так считаете.

x