Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Здесь есть возможность читать онлайн «Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры» — ознакомительный отрывок электронной книги совершенно бесплатно, а после прочтения отрывка купить полную версию. В некоторых случаях можно слушать аудио, скачать через торрент в формате fb2 и присутствует краткое содержание. Город: Москва, Год выпуска: 2016, ISBN: 2016, Издательство: АСТ, Жанр: Базы данных, foreign_comp, foreign_edu, Прочая научная литература, на русском языке. Описание произведения, (предисловие) а так же отзывы посетителей доступны на портале библиотеки ЛибКат.

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры: краткое содержание, описание и аннотация

Предлагаем к чтению аннотацию, описание, краткое содержание или предисловие (зависит от того, что написал сам автор книги «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры»). Если вы не нашли необходимую информацию о книге — напишите в комментариях, мы постараемся отыскать её.

Насколько велики на самом деле «большие данные» – огромные массивы информации, о которых так много говорят в последнее время? Вот наглядный пример: если выписать в линейку все цифры 0 и 1, из которых состоит один терабайт информации (вполне обычная емкость для современного жесткого диска), то цепочка цифр окажется в 50 раз длиннее, чем расстояние от Земли до Сатурна! И тем не менее, на «большие данные» вполне можно взглянуть в человеческом измерении. Эрец Эйден и Жан-Батист Мишель – лингвисты и компьютерные гении, создатели сервиса Google Ngram Viewer и термина «культуромика», показывают, каким образом анализ «больших данных» помогает исследовать трудные проблемы языка, культуры и истории.

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры — читать онлайн ознакомительный отрывок

Ниже представлен текст книги, разбитый по страницам. Система сохранения места последней прочитанной страницы, позволяет с удобством читать онлайн бесплатно книгу «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры», без необходимости каждый раз заново искать на чём Вы остановились. Поставьте закладку, и сможете в любой момент перейти на страницу, на которой закончили чтение.

Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

И процесс, благодаря которому они выжили, мы как раз и намеревались изучить – процесс эволюции языка.

2005: Еще одна одиссея данных

Почему же некоторые неправильные глаголы умерли, а другим удалось выжить? Почему глаголу throve (от глагола thrive – «процветать») не удалось выжить, а глаголу drove (от глагола drive – «ехать») – удалось? [62]

У лингвистов уже есть несколько отличных идей относительно того, почему неправильные глаголы имеют столь высокую частотность. Они предположили, что чем меньше мы сталкиваемся с неправильным глаголом, тем сложнее его запомнить и тем проще забыть [63]. Вследствие чего редкие неправильные глаголы вроде throve исчезают быстрее, чем частые, вроде drove . Со временем неправильные глаголы с низкой частотой употребления полностью исчезали, а неправильные глаголы как группа становились более частыми.

Эта гипотеза показалась нам в высшей степени интересной, поскольку предполагала, что неправильные глаголы проходят через определенный процесс, аналогичный эволюции, путем естественного отбора [64]. Почему неправильные глаголы встречаются настолько часто, когда, в полном соответствии с законом Ципфа, во всех остальных лексических классах доминируют редкие слова? Потому что естественный отбор, в форме ненасытного правила – ed , обеспечивает простым неправильным глаголам эволюционное преимущество. Чем чаще глагол используется, тем выше его шансы на выживание.

Созданный Ципфом «компас» был на тот момент самым идеальным примером естественного отбора, действующего в человеческой культуре, с которым нам только доводилось сталкиваться. Компас Ципфа указал нам на увлекательную проблему: может ли сформироваться лингвистическое чутье при столь тщательном изучении материала? Это могло бы стать простой, но доходчивой иллюстрацией того, что человеческая культура способна развиваться путем естественного отбора. Теперь нам, как и Ципфу, требовалось лишь найти подтверждение.

Для помощи в поисках мы привлекли к работе двух невероятно талантливых старшекурсников Гарвардского колледжа, Джо Джексона и Тину Тан. В идеале мы надеялись, что Джо и Тина смогут прочитать все источники, когда-либо опубликованные на английском языке, и записать каждый пример неправильного глагола, с которым они сталкивались. Однако оба они сказали нам, что все же хотели бы поработать над своими дипломами (для нас как аспирантов это уже был пройденный и забытый этап). Для решения задачи нам пришлось импровизировать.

К счастью, Джо и Тина учли историю Ципфа, поэтому предложили альтернативный подход. Вместо того чтобы читать абсолютно все, почему бы не ограничиться учебниками по истории английской грамматики? Грамматические тексты, относящиеся, скажем, к средневековому английскому языку, наверняка касались бы вопроса неправильных глаголов и упоминали бы многие из них. Не исключено, что где-то можно было найти и список таких глаголов. Изучив в библиотеке каждый учебник, посвященный истории английского языка различных периодов, мы могли получить довольно точную картину того, какие глаголы считались неправильными и когда [65]. Учебники могли бы дать нам то же самое, что дало Ципфу проведенное Хенли исследование «Улисса».

Разумеется, сказать проще, чем сделать. Джо и Тина посвятили несколько месяцев кропотливой работе, читая учебники древнеанглийского языка (языка «Беовульфа», на котором говорили примерно в 800 г. н. э.) и средневекового английского (языка Чосера, на котором говорили начиная примерно с XII столетия). Они нашли 177 староанглийских неправильных глаголов, развитие каждого из которых они смогли проследить на протяжении тысячи и более лет. Получив такую картину, мы наконец увидели, как менялся язык.

В древнеанглийском языке все 177 глаголов изначально были неправильными. К началу Средневековья, через четыре столетия, выжило лишь 145 неправильных форм; остальные 32 были приведены в соответствие с новыми нормами. В современном английском языке неправильными остались лишь 98. Остальные 79 глаголов до сих пор присутствуют в языке, однако, подобно глаголу melt («таять»), они изменили форму. При этом был заметен довольно примечательный дисбаланс. Из 12 наиболее часто встречающихся глаголов в нашем списке ни один не стал правильным – им удалось на протяжении 12 столетий сопротивляться давлению со стороны правила – ed . Нарушение пропорций шло и с другой стороны. Из 12 наименее часто использовавшихся глаголов в списке 11 стали правильными, в том числе bide («пребывать») и wreak («причинять»). Единственным выжившим неправильным глаголом с низкой частотой оказался slink («красться») – глагол, который как раз четко описывает этот тихий процесс исчезновения [66].

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Похожие книги на «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры»

Представляем Вашему вниманию похожие книги на «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры» списком для выбора. Мы отобрали схожую по названию и смыслу литературу в надежде предоставить читателям больше вариантов отыскать новые, интересные, ещё непрочитанные произведения.


Отзывы о книге «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры»

Обсуждение, отзывы о книге «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры» и просто собственные мнения читателей. Оставьте ваши комментарии, напишите, что Вы думаете о произведении, его смысле или главных героях. Укажите что конкретно понравилось, а что нет, и почему Вы так считаете.

x