Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Здесь есть возможность читать онлайн «Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры» — ознакомительный отрывок электронной книги совершенно бесплатно, а после прочтения отрывка купить полную версию. В некоторых случаях можно слушать аудио, скачать через торрент в формате fb2 и присутствует краткое содержание. Город: Москва, Год выпуска: 2016, ISBN: 2016, Издательство: АСТ, Жанр: Базы данных, foreign_comp, foreign_edu, Прочая научная литература, на русском языке. Описание произведения, (предисловие) а так же отзывы посетителей доступны на портале библиотеки ЛибКат.

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры: краткое содержание, описание и аннотация

Предлагаем к чтению аннотацию, описание, краткое содержание или предисловие (зависит от того, что написал сам автор книги «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры»). Если вы не нашли необходимую информацию о книге — напишите в комментариях, мы постараемся отыскать её.

Насколько велики на самом деле «большие данные» – огромные массивы информации, о которых так много говорят в последнее время? Вот наглядный пример: если выписать в линейку все цифры 0 и 1, из которых состоит один терабайт информации (вполне обычная емкость для современного жесткого диска), то цепочка цифр окажется в 50 раз длиннее, чем расстояние от Земли до Сатурна! И тем не менее, на «большие данные» вполне можно взглянуть в человеческом измерении. Эрец Эйден и Жан-Батист Мишель – лингвисты и компьютерные гении, создатели сервиса Google Ngram Viewer и термина «культуромика», показывают, каким образом анализ «больших данных» помогает исследовать трудные проблемы языка, культуры и истории.

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры — читать онлайн ознакомительный отрывок

Ниже представлен текст книги, разбитый по страницам. Система сохранения места последней прочитанной страницы, позволяет с удобством читать онлайн бесплатно книгу «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры», без необходимости каждый раз заново искать на чём Вы остановились. Поставьте закладку, и сможете в любой момент перейти на страницу, на которой закончили чтение.

Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Андворд, как и Ципф, отправился на поиски данных. К счастью для него и всей истории медицины, норвежское правительство прилагало серьезные усилия для ведения статистики по смертности. Андворд смог получить правительственные данные, охватывавшие период с 1896 по 1927 годы. Он дополнил результаты по Норвегии массивами данных из Англии, Уэльса, Дании и Швеции. Вооружившись всей этой информацией, Андворд стал задавать простые вопросы, волновавшие его прежде, и получать на них ответы. Например, в каком возрасте чаще умирали от туберкулеза люди, родившиеся в 1900 году (когорта 1900 года)? Как это соотносилось с данными когорты 1910 или 1920 года?

Полученные им ответы поражали. Судя по ним, жертвы заболевания могли (вне зависимости от своего года рождения) столкнуться с туберкулезом в возрасте между 5 и 14 годами или в период от 20 до 24 лет. Проведенный Андвордом анализ когорт показал, что туберкулез – это прежде всего болезнь молодых.

Но почему же, если взглянуть на все население, средний возраст жертв туберкулеза увеличивался? Ответ на этот вопрос был получен после того, как Андворд изучил общие данные по заболеваниям – точнее, вероятность того, что член определенной когорты (молодой или старый) в какой-то момент своей жизни умрет от туберкулеза. Когда Андворд принялся изучать все более молодые когорты, он обнаружил, что количество смертельных случаев стабильно уменьшалось. Норвежцы, рожденные в 1920 году, имели меньше шансов столкнуться с туберкулезом в течение своей жизни, чем норвежцы, родившиеся в 1910-м (у которых, в свою очередь, было меньше шансов заболеть, чем у норвежцев, родившихся в 1900 году, и так далее).

Это открытие заставило его взглянуть на возраст по-новому. Дело было не в том, что болезнь распространилась на людей старшего возраста. Андворд сделал вывод о том, что люди, родившиеся раньше, были более уязвимы к заболеванию туберкулезом в течение своей жизни. Немедленным последствием его выводов стала настоящая медицинская «бомба» – молодые норвежцы все лучше противостояли туберкулезу от поколения к поколению. По сути, эпидемия действовала, как убийственная, но очень эффективная кампания по вакцинации. Хотя вывод Андворда был неожиданным и поразительным, он оказался при этом совершенно верным. Но его наследие не ограничилось этим. Метод исследования когорт Андворда превратился в важнейший научный инструмент в области эпидемиологии и общественного здоровья. Идеи Андворда успешно срабатывают каждый раз, когда у нас появляется возможность изучить обширные массивы данных, касающихся состояния здоровья общества. Благодаря Андворду (или, возможно, его медсестре) мы узнали о связи между высоким кровяным давлением и сердечно-сосудистыми заболеваниями, курением и раком легких, уровнем сахара в крови и диабетом, а также о десятках тысяч других корреляций, заставляющих нас испытывать чувство вины при любом нарушении режима питания.

Подобно исследованиям туберкулеза, исследования славы пронизаны массой фактов и идей, связанных с различиями между поколениями. Например, изобретение Интернета оказало огромное влияние на то, как люди становятся знаменитыми. В нашем изначальном исследовании подобные факторы практически не позволяли увидеть, что же происходит на самом деле.

Наконец мы сделали то, что сделал бы любой хороший ученый, ищущий данные. Мы спросили себя: WWAD ( What Would Andvord Do – «Что бы сделал Андворд»)? Внезапно нам стало понятно – мы должны использовать метод когорт, то есть относиться к славе как к болезни.

Зал славы

В то время мы только что познакомились с Адрианом Вересом [126]. Этот по-настоящему талантливый старшекурсник кое-что знал о мировой славе – он получил первый приз на международной научной и инженерной выставке, проводившейся при поддержке компании Intel , после чего в его честь была названа одна малая планета (921758 Adrianveres ).

Работая с Адрианом, мы занялись созданием когорт, состоявших из представителей каждого поколения, серьезно прославившихся, – людей уровня Марка Твена, Ганди или Рузвельта. Мы решили заняться изучением людей, рожденных в промежутке между 1800 и 1950 годами. Взяв более ранний период, мы столкнулись бы с ситуацией низкого качества данных. А взяв более поздний период, мы не смогли бы отслеживать славу в течение достаточно длительного времени – зачастую человек, рожденный в 1950 году, становился знаменитым лишь в 80-е или даже 90-е, так что у нас было бы слишком мало данных для анализа по годам. Адриан проанализировал данные сотен тысяч людей, изучая частоту упоминания их полных имен (к примеру, «Марк Твен»). Для каждого года за период между 1800 и 1950 годами он составил список из пятидесяти самых знаменитых людей, родившихся в том же году. Это была крайне впечатляющая работа с учетом того, что на родной планете Адриану исполнилось всего шесть лет [127]. Если приравнять известность к болезни, то списки Адриана содержали 7500 наиболее пострадавших жертв недуга [128].

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Похожие книги на «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры»

Представляем Вашему вниманию похожие книги на «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры» списком для выбора. Мы отобрали схожую по названию и смыслу литературу в надежде предоставить читателям больше вариантов отыскать новые, интересные, ещё непрочитанные произведения.


Отзывы о книге «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры»

Обсуждение, отзывы о книге «Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры» и просто собственные мнения читателей. Оставьте ваши комментарии, напишите, что Вы думаете о произведении, его смысле или главных героях. Укажите что конкретно понравилось, а что нет, и почему Вы так считаете.

x