Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Здесь есть возможность читать онлайн «Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры» — ознакомительный отрывок электронной книги совершенно бесплатно, а после прочтения отрывка купить полную версию. В некоторых случаях можно слушать аудио, скачать через торрент в формате fb2 и присутствует краткое содержание. Город: Москва, Год выпуска: 2016, ISBN: 2016, Издательство: АСТ, Жанр: Базы данных, foreign_comp, foreign_edu, Прочая научная литература, на русском языке. Описание произведения, (предисловие) а так же отзывы посетителей доступны на портале библиотеки ЛибКат.

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры: краткое содержание, описание и аннотация

Предлагаем к чтению аннотацию, описание, краткое содержание или предисловие (зависит от того, что написал сам автор книги «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры»). Если вы не нашли необходимую информацию о книге — напишите в комментариях, мы постараемся отыскать её.

Насколько велики на самом деле «большие данные» – огромные массивы информации, о которых так много говорят в последнее время? Вот наглядный пример: если выписать в линейку все цифры 0 и 1, из которых состоит один терабайт информации (вполне обычная емкость для современного жесткого диска), то цепочка цифр окажется в 50 раз длиннее, чем расстояние от Земли до Сатурна! И тем не менее, на «большие данные» вполне можно взглянуть в человеческом измерении. Эрец Эйден и Жан-Батист Мишель – лингвисты и компьютерные гении, создатели сервиса Google Ngram Viewer и термина «культуромика», показывают, каким образом анализ «больших данных» помогает исследовать трудные проблемы языка, культуры и истории.

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры — читать онлайн ознакомительный отрывок

Ниже представлен текст книги, разбитый по страницам. Система сохранения места последней прочитанной страницы, позволяет с удобством читать онлайн бесплатно книгу «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры», без необходимости каждый раз заново искать на чём Вы остановились. Поставьте закладку, и сможете в любой момент перейти на страницу, на которой закончили чтение.

Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Книги в своем физическом виде находятся под угрозой даже в своей привычной цитадели – библиотеке [200]. На протяжении тысячелетий библиотека была единственным учреждением, призванным сохранять исторические записи. Однако в отличие от активно развивающихся онлайн-библиотек, их традиционные физические сородичи сталкиваются с большими проблемами. Через несколько лет у 60% библиотек бюджет снизится или вообще исчезнет. При отсутствии достаточного объема площадей и финансов библиотекам придется избавляться от целого ряда старых книг, чтобы выделить место для новых. Проблема состоит в том, что библиотеки не могут просто раздать свои старые книги. В библиотечные книги встроены специальные устройства, препятствующие воровству. И это приведет к тому, что честные люди будут время от времени считать, что эти книги были когда-то похищены из библиотек, и приносить их обратно. Удалять эти отслеживающие устройства довольно дорого. Поэтому библиотеки часто предпочитают сделать то, что кажется нам немыслимым, – они тайно уничтожают книги. Это происходит в огромных масштабах. Крупные библиотеки иногда разом избавляются от сотен тысяч книг.

Какие же книги покидают библиотеки? Практика варьируется, однако в целом библиотеки не особенно церемонятся с книгами. Мало кто прилагает усилия для отслеживания того, что мы теряем. В одном недавнем случае были уничтожены книги из библиотеки бывшего британского премьер-министра Дэвида Ллойд-Джорджа. Время от времени библиотека будет решать, от каких книг избавиться, проверяя, какие из них уже оцифровала Google . В результате мы внезапно можем лишиться значительной доли своего культурного наследия. Несколько глав назад мы рассказали о том, как цензура способна задавить те или иные идеи. Здесь же происходит обратное – попытки сделать книги более доступными угрожают их физическому выживанию. Оцифровка книг приводит к весьма противоречивым результатам.

Газеты.Разумеется, исторические записи не ограничиваются одними лишь книгами. К примеру, «кругосветный розыгрыш» По появился в газете. Старые газеты представляют собой уникальный ресурс, в котором отражены повседневные проблемы городов, общественных движений и других социальных групп. Насколько велики шансы найти цифровое издание «кругосветного розыгрыша» По?

Поначалу мы считали, что шансы на это велики. Оцифровка старых газет приобрела значительные масштабы. К настоящему времени ведущие газеты вроде New York Times, Boston Globe и многих других уже полностью оцифровали свои архивы. Национальный фонд гуманитарных наук профинансировал оцифровку старых американских газет – около шести миллионов страниц, отражавших историю целого столетия. Прогрессировали и другие страны. В рамках одного лишь проекта Australia’s Trove было оцифровано около ста миллионов газетных статей. Этой деятельностью в течение какого-то периода занималась и Google , оцифровав архивы двух тысяч газет [201].

Однако, несмотря на эти впечатляющие шаги, никакие усилия по оцифровке газет не сопоставимы по масштабу и покрытию с книжным проектом Google .

Идеальным примером этого неравенства может считаться «кругосветный розыгрыш» По. Найти цифровое издание этого розыгрыша несложно. Однако это связано с успехом оцифровки книг, а не газет. Хвост этой истории настолько велик, что рассказ о ней возникает во множестве книг, описывающих жизнь и работу По. Эти книги, как и книги самого По, уже были оцифрованы.

Однако вам не удастся найти цифровую копию газеты, которая изначально опубликовала эту историю. Национальный гуманитарный фонд профинансировал оцифровку выпусков нью-йоркской газеты Sun лишь за период с 1859 по 1920 год. Розыгрыш, опубликованный в 1844 году, оказывается очередным «белым пятном» в процессе оцифровки газет. Основная масса газетных статей, написанных По, не оцифрована, и никто не знает, когда это будет сделано.

Неопубликованные тексты.Книгопечатание представляет собой сравнительно недавнее изобретение. До появления печатного станка тексты распространялись в виде рукописей, написанных и скопированных от руки. В наши дни множество прекрасных текстов выживает лишь в этой форме. Многие знаменитые рукописи, наподобие манускриптов Мертвого моря, уже были оцифрованы, также как и другие важные коллекции, например греческие рукописи в Британской библиотеке. Однако систематические усилия по оцифровке рукописей предпринимаются лишь на местном уровне [202].

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Похожие книги на «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры»

Представляем Вашему вниманию похожие книги на «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры» списком для выбора. Мы отобрали схожую по названию и смыслу литературу в надежде предоставить читателям больше вариантов отыскать новые, интересные, ещё непрочитанные произведения.


Отзывы о книге «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры»

Обсуждение, отзывы о книге «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры» и просто собственные мнения читателей. Оставьте ваши комментарии, напишите, что Вы думаете о произведении, его смысле или главных героях. Укажите что конкретно понравилось, а что нет, и почему Вы так считаете.

x