Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Здесь есть возможность читать онлайн «Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры» — ознакомительный отрывок электронной книги совершенно бесплатно, а после прочтения отрывка купить полную версию. В некоторых случаях можно слушать аудио, скачать через торрент в формате fb2 и присутствует краткое содержание. Город: Москва, Год выпуска: 2016, ISBN: 2016, Издательство: АСТ, Жанр: Базы данных, foreign_comp, foreign_edu, Прочая научная литература, на русском языке. Описание произведения, (предисловие) а так же отзывы посетителей доступны на портале библиотеки ЛибКат.

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры: краткое содержание, описание и аннотация

Предлагаем к чтению аннотацию, описание, краткое содержание или предисловие (зависит от того, что написал сам автор книги «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры»). Если вы не нашли необходимую информацию о книге — напишите в комментариях, мы постараемся отыскать её.

Насколько велики на самом деле «большие данные» – огромные массивы информации, о которых так много говорят в последнее время? Вот наглядный пример: если выписать в линейку все цифры 0 и 1, из которых состоит один терабайт информации (вполне обычная емкость для современного жесткого диска), то цепочка цифр окажется в 50 раз длиннее, чем расстояние от Земли до Сатурна! И тем не менее, на «большие данные» вполне можно взглянуть в человеческом измерении. Эрец Эйден и Жан-Батист Мишель – лингвисты и компьютерные гении, создатели сервиса Google Ngram Viewer и термина «культуромика», показывают, каким образом анализ «больших данных» помогает исследовать трудные проблемы языка, культуры и истории.

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры — читать онлайн ознакомительный отрывок

Ниже представлен текст книги, разбитый по страницам. Система сохранения места последней прочитанной страницы, позволяет с удобством читать онлайн бесплатно книгу «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры», без необходимости каждый раз заново искать на чём Вы остановились. Поставьте закладку, и сможете в любой момент перейти на страницу, на которой закончили чтение.

Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

193

Дополнительную информацию о миссиях «Маринер» можно найти в: Hamilton John. The Mariner Missions to Mars. Minneapolis: ABDO, 1998.

194

См. II Сам. 24.

195

См. Meyers Jeffrey. Edgar Allan Poe: His Life and Legacy. New York: Charles Scribner’s Sons, 1992. Факсимиле «трансатлантического розыгрыша» По в низком разрешении приводится в: Réseau Pneumatic de Paris. Cix, 2000, доступно в сети Интернет: http://goo.gl/nCo3s.

196

Самая свежая версия базы для создания n -грамов черпает информацию из 8 миллионов книг и позволяет создавать тэги для частей речи. См. Lin Yuri et al. Syntactic Annotations for the Google Books Ngram Corpus // Proceedings of the ACL 2012 System Demonstrations (2012). P. 169–174; Lin Yuri. Syntactically Annotated Ngrams for Google Books. Massachusetts Institute of Technology, 2012 (магистерская диссертация).

197

См. Darnton Robert. The National Digital Public Library Is Launched! // New York Review of Books (25 апреля 2013 г.), доступно в сети Интернет: http://goo.gl/OI5n2J.

198

The HathiTrust (http://www.hathitrust.org), Internet Archives (http://archive.org/index.php), проект «Гутенберг» (http://www.gutenberg.org) и Digital Public Library of America (http://dp.la) – это лишь несколько примеров заметных проектов по выкладыванию цифровых книг в широкий доступ. При наличии полных текстов человек может создать значительно более мощные инструменты для анализа культурных трендов. Пример такого инструмента находится на сайте: http://bookworm.culturomics.org. Произведенная компанией Google адаптация первоначального Bookworm с закрытым кодом использует название Ngram Viewer. Bookworm представляет собой проект Cultural Observatory с открытым кодом. Программный код Bookworm был разработан при участии Бенджамина Шмидта, Невы Чернявски-Дюран, Мартина Камачо, Мэттью Никлей и Линфэн Ян. Основным разработчиком был Шмидт.

199

К 2009 году Amazon уже продавал больше электронных книг, чем книг в твердой обложке. См.: Sorrel Charlie. Amazon: Kindle Books Outsold Real Books This Christmas // Wired (28 декабря 2009 г.), доступно в сети Интернет: http://goo.gl/ZsB7it. В 2012 году электронные книги составляли 23% книжного рынка в Соединенных Штатах. См.: Greenfield Jeremy. Ebooks Account for 23% of Publisher Revenue in 2012, Even as Growth Levels // Digital Book World (11 апреля 2013 г.), доступно в сети Интернет: http://goo.gl/u0d1GJ.

200

См.: Davis S. Peter. 6 Reasons We’re in Another «Book-Burning» Period in History // Cracked (11 октября 2011 г.), доступно в сети Интернет: http://goo.gl/FBZoD; Shaer Matthew. Dead Books Club // New York (12 августа 2012 г.), доступно в сети Интернет: http://goo.gl/UAIDN; Jones Mari. David Lloyd George’s Books Pulped by Conwy Libraries Services // Daily Post (24 марта 2011 г.), доступно в сети Интернет: http://goo.gl/b1pK0; Carter Helen. Authors and Poets Call Halt to Book Pulping at Manchester Central Library // Guardian (22 июня 2012 г.), доступно в сети Интернет: http://goo.gl/lEas1P.

201

См.: Chronicling America // National Endowment for the Humanities, URL: http://chroniclingamerica.loc.gov; Trove // National Library of Australia, URL: http://trove.nla.gov.au; приостановленный проект Google News Archive // Google News, URL: http://news.google.com/newspapers.

202

См., к примеру, Digitized Dead Sea Scrolls // Israel Museum, Jerusalem, URL: http://dss.collections.imj.org.il; Perseus Digital Library, Tufts University, URL: http://www.perseus.tufts.edu. Подробнее о проекте по оцифровке документов, связанных с По, можно узнать в The Edgar Allan Poe Digital Collection // Harry Ransom Center, University of Texas Austin, доступно в сети Интернет: http://goo.gl/XvcqO.

203

См. Europeana , URL: http://europeana.eu, – пример серьезных усилий по организации доступа к текстам, произведениям изобразительного искусства, фильмам и множеству других культурных объектов в Европе.

204

Из 107 триллионов электронных писем, отправленных в 2010 году, 89,1% составил спам. См. Internet 2010 in Numbers // Royal Pingdom (12 января 2011 г.), доступно в сети Интернет: http://goo.gl/ziXncU.

205

См.: James Josh. How Much Data Is Created Every Minute? // DOMO (8 июня 2012 г.), доступно в сети Интернет: http://goo.gl/RN5eB. Профессор Грегори Крейн, главный редактор Perseus Library Project , поставивший своей целью оцифровать все древнегреческие тексты, предположил, что со времен 600 года до н. э. сохранилось примерно сто миллионов слов из греческого языка; Грегори Крейн, электронное письмо Жану-Батисту Мишелю, 18 мая 2013 г.

206

Презентация Деба Роя по этому вопросу на конференции TED заслуживает внимания и очень информативна. См.: Roy Deb. The Birth of a Word, видео, 19:52 (март 2011 г.), доступно в сети Интернет: http://goo.gl/5MoJo. Подробнее об этом проекте см.: Keats Jonathan. The Power of Babble // Wired (март 2007 г.), доступно в сети Интернет: http://goo.gl/3epTR; Jones Jason B. Making That Home Video Count // Wired (25 марта 2011 г.), доступно в сети Интернет: http://archive.wired.com/geekdad/2011/03/making-that-home-video-count-deb-roy-and-the-birth-of-a-word/. Описание с техническими характеристиками можно найти в: Roy Deb et al. The Human Speechome Project // Massachusetts Institute of Technology (июль 2006 г.), доступно в сети Интернет: http://goo.gl/O3E0e; Kubat Rony et al. TotalRecall: Visualization and Semi-Automatic Annotation of Very Large Audio-Visual Corpora // Massachusetts Institute of Technology, доступно в сети Интернет: http://goo.gl/Dra7T.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Похожие книги на «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры»

Представляем Вашему вниманию похожие книги на «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры» списком для выбора. Мы отобрали схожую по названию и смыслу литературу в надежде предоставить читателям больше вариантов отыскать новые, интересные, ещё непрочитанные произведения.


Отзывы о книге «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры»

Обсуждение, отзывы о книге «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры» и просто собственные мнения читателей. Оставьте ваши комментарии, напишите, что Вы думаете о произведении, его смысле или главных героях. Укажите что конкретно понравилось, а что нет, и почему Вы так считаете.

x