3. Большие данные: парадигма 4.0 или только 3.1?
Начиная с численных наблюдений движения планет, выполненных в XVI в. датским астрономом Тихо Браге, измерения играют центральную роль в развитии нашего понимания всей окружающей нас Вселенной. Данные образуют основу для построения, проверки и уточнения наших теорий и моделей, идет ли речь о попытках объяснить происхождение Вселенной, природу эволюционных процессов или рост экономики.
Данные – это то, чем живут наука, техника и технологии, а в последние годы они стали играть все более важную роль в экономике и финансах, в политике и в коммерции. Почти что никакие из тех задач, о которых я говорил в этой книге, не могли бы быть проанализированы без использования огромных объемов данных. Более того, не имея доступа к таким данным, на которые я опирался в предыдущих главах, мы не могли бы серьезно думать о развитии чего-либо даже близкого к теории сложных адаптивных систем или научной теории городов, компаний или устойчивости. Хорошим примером являются данные миллиардов вызовов сотовой связи, которые мы использовали в своей работе для проверки предсказаний относительно роли социальных сетей и перемещений людей в городах.
Важнейшую роль в этих недавних событиях сыграла революция в информационных технологиях, и речь здесь идет не только о сборе и накоплении данных, но и об анализе и преобразовании огромных объемов вновь возникающей информации в пригодную для обработки форму, которая позволяет делать наблюдения, замечать закономерности или формулировать и проверять предсказания. Скорость и вместимость даже того тринадцатидюймового компьютера MacBook Air, на котором я печатаю эту рукопись, поразительны, а возможности, которые он предоставляет для анализа и извлечения данных, сохранения информации и выполнения сложных вычислений, поистине необычайны. Мой маленький iPad обладает большей мощностью, чем машина Cray-2, бывшая всего двадцать пять лет назад самым мощным в мире суперкомпьютером и стоившая около 15 миллионов долларов. Объемы данных, которые собирают сейчас многочисленные устройства, отслеживающие почти все, что нас окружает, от наших тел, социальных взаимодействий, перемещений и предпочтений до погодных условий и дорожной обстановки, поражают воображение.
Число сетевых устройств, имеющихся сейчас в мире, более чем в два раза превышает общую численность населения Земли, а суммарная площадь их экранов такова, что на каждого человека приходится более 900 кв. см. Мы в самом деле вступили в эпоху больших данных. Объем сохраняемой и передаваемой информации продолжает экспоненциально расти. И все это началось в последнее десятилетие или около того, что служит еще одним ярким проявлением ускорения темпа жизни. Пришествие больших данных провозглашалось в сопровождении громких и преувеличенных обещаний, из которых следовало, что они-то и избавят нас от всех надвигающихся проблем во всех областях, от здравоохранения до урбанизации, и в то же время обеспечат еще более высокий уровень жизни. Нужно только измерять и контролировать все на свете и загружать данные в огромные компьютеры, а те как по волшебству будут выдавать нам ответы и решения, и тогда все наши проблемы и затруднения будут преодолены, и мы поголовно будем счастливы. Эта развивающаяся парадигма хорошо вписывается в захлестывающий нас поток «умных» устройств и методик, которые все в большей степени господствуют в нашей жизни. «Умным» теперь непременно должно быть все новое, будь то умные города, умная медицина, умные термостаты, умные телефоны, умные карты или даже умная упаковка.
Данные – это хорошо, а много данных – еще лучше: таково кредо, которое большинство из нас, особенно если речь идет об ученых, воспринимает как нечто само собой разумеющееся. Но в основе этой веры лежит идея о том, что увеличение количества данных приводит к более глубокому пониманию фундаментальных механизмов и принципов, которое позволило бы построить на прочном основании более правдоподобные предсказания и более точные модели и теории, подлежащие дальнейшим проверкам и уточнениям. Данные ради данных, бездумное накопление больших данных без концептуальной основы для их организации и понимания может быть занятием неправильным и даже опасным. Заключения, основанные на одних только данных или даже на математической аппроксимации данных без глубинного понимания механизмов, которые их порождают, могут быть обманчивыми и приводить к ошибочным выводам и непредвиденным последствиям.
Читать дальше
Конец ознакомительного отрывка
Купить книгу