Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Здесь есть возможность читать онлайн «Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры» — ознакомительный отрывок электронной книги совершенно бесплатно, а после прочтения отрывка купить полную версию. В некоторых случаях можно слушать аудио, скачать через торрент в формате fb2 и присутствует краткое содержание. Город: Москва, Год выпуска: 2016, ISBN: 2016, Издательство: АСТ, Жанр: Базы данных, foreign_comp, foreign_edu, Прочая научная литература, на русском языке. Описание произведения, (предисловие) а так же отзывы посетителей доступны на портале библиотеки ЛибКат.

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры: краткое содержание, описание и аннотация

Предлагаем к чтению аннотацию, описание, краткое содержание или предисловие (зависит от того, что написал сам автор книги «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры»). Если вы не нашли необходимую информацию о книге — напишите в комментариях, мы постараемся отыскать её.

Насколько велики на самом деле «большие данные» – огромные массивы информации, о которых так много говорят в последнее время? Вот наглядный пример: если выписать в линейку все цифры 0 и 1, из которых состоит один терабайт информации (вполне обычная емкость для современного жесткого диска), то цепочка цифр окажется в 50 раз длиннее, чем расстояние от Земли до Сатурна! И тем не менее, на «большие данные» вполне можно взглянуть в человеческом измерении. Эрец Эйден и Жан-Батист Мишель – лингвисты и компьютерные гении, создатели сервиса Google Ngram Viewer и термина «культуромика», показывают, каким образом анализ «больших данных» помогает исследовать трудные проблемы языка, культуры и истории.

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры — читать онлайн ознакомительный отрывок

Ниже представлен текст книги, разбитый по страницам. Система сохранения места последней прочитанной страницы, позволяет с удобством читать онлайн бесплатно книгу «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры», без необходимости каждый раз заново искать на чём Вы остановились. Поставьте закладку, и сможете в любой момент перейти на страницу, на которой закончили чтение.

Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать
На Западе упоминания о Тяньаньмэнь не умолкают и после 1989 года В Китае же - фото 24

На Западе упоминания о Тяньаньмэнь не умолкают и после 1989 года. В Китае же был заметен небольшой скачок интереса (даже не приблизившийся к уровню 1976 года) – после чего все вернулось к прежнему состоянию.

Бойня на площади Тяньаньмэнь представляет собой одно из центральных событий в современной истории Китая. Однако ее никто не обсуждает (по крайней мере в печати). Многие о ней даже не знают. Душераздирающий график на стр. 181 представляет собой яркое свидетельство жестокой эффективности цензуры в современном Китае.

Можем ли мы распознавать цензуру автоматически?

Вне зависимости от того, где возникают цензура и подавление, они часто оставляют характерную отметку: внезапное исчезновение определенных слов и фраз. Статистическая подпись этого лексического пробела зачастую выглядит настолько явно, что мы можем использовать цифры – большие данные, чтобы понять, что именно стало объектом цензуры.

Давайте вернемся к нацистской Германии и посмотрим, как это работает. Наша цель состоит в том, чтобы найти людей, слава которых, как и слава Шагала, исчезала во времена Третьего рейха, с 1933 по 1945 год. Мы можем измерить величину этого падения, сравнивая славу человека во времена Третьего рейха со славой до и после этого времени. Если во времена нацистского режима человек упоминался в одном случае на 100 миллионов, а в 20-х и 50-х годах один раз на 10 миллионов, то можно говорить о десятикратном падении. С другой стороны, если частота употреблений в годы нацистского режима вырастает в 10 раз, то можно сказать, что человек был особенно знаменитым именно в этот период и, возможно, извлекал определенную пользу из правительственной пропаганды. Таким образом, мы можем выбирать любое имя и присвоить ему показатель подавления, отражающий величину падения или роста. А это, в свою очередь, помогает нам определить, кто подвергался подавлению со стороны окружавшего общества.

Мы применили этот автоматический детектор в отношении тысяч имен знаменитых людей, живших во времена Второй мировой войны, и создали два совмещенных графика. Первый график, показывает показатель подавления для английского языка. Большинство линий близки к единице – никаких взлетов или падений. Менее чем у 1% изменение в том или ином направлении составило более пяти единиц. В графике нет ничего особенного – результаты для английского языка вполне типичны и очень напоминают то, что мы видели почти во всех языках и почти во все периоды времени.

Второй график показывает результаты для немецкого языка во времена нацистского - фото 25

Второй график, показывает результаты для немецкого языка во времена нацистского режима. Он выглядит совершенно иначе. Прежде всего он не отцентрирован, а смещен немного влево. Большинство людей в той или иной степени подавлялись режимом, у них произошло значительное падение уровня славы. Однако центр сместился не поэтому. Распределение значительно шире и включает в себя куда больше крайних значений. Лишь немногие из них располагаются справа, где мы ожидаем увидеть сторонников правительственной пропаганды. Большинство оказывается далеко слева – свыше 10% людей в нашем списке столкнулись с падением славы в пять и более раз.

Имена слева принадлежат Пикассо и Вальтеру Гропиусу, основателю движения «Баухауз» в изобразительном искусстве, архитектуре и дизайне. Продвинувшись еще левее, вы найдете имя Германна Мааса, протестантского священника, публично осуждавшего нацистов и помогавшего евреям получать визы на выезд из Германии. За эти усилия Рейх начал против него адресную кампанию. Разумеется, мы не первые, кто заметил невероятный героизм Мааса, – в 1964-м Яд ва-Шем, национальный израильский музей холокоста, признал Мааса одним из «Праведников мира».

Нарисовав этот график, мы попросили одну знакомую из Яд ва-Шем самостоятельно решить, руководствуясь инструментами обычного историка, какие имена должны появиться на каждом конце кривой. Мы не предоставили ей доступа к нашим данным или результатам, а также не объяснили ей, почему задаем такие вопросы. Все, что она от нас получила, был список имен. Тем не менее ее ответы в большинстве случаев соответствовали нашим.

Таким образом, наша техника статистического выявления цензуры обеспечивает результаты, идентичные качественным инструментам и традиционным методам традиционного историка [163]. Однако, в отличие от традиционных методов, наш анализ при помощи компьютера может занимать считаные мгновения.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Похожие книги на «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры»

Представляем Вашему вниманию похожие книги на «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры» списком для выбора. Мы отобрали схожую по названию и смыслу литературу в надежде предоставить читателям больше вариантов отыскать новые, интересные, ещё непрочитанные произведения.


Отзывы о книге «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры»

Обсуждение, отзывы о книге «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры» и просто собственные мнения читателей. Оставьте ваши комментарии, напишите, что Вы думаете о произведении, его смысле или главных героях. Укажите что конкретно понравилось, а что нет, и почему Вы так считаете.

x