Большие данные и умные города
С начала компьютерной эры данные о городах все в большей степени приобретают цифровую природу: их либо оцифровывают с аналоговых носителей (набирают вручную или сканируют), либо сразу создают в цифровом формате при помощи цифровых устройств, хранят в форме электронных файлов и баз данных, обрабатывают и анализируют с помощью различных систем программного обеспечения, таких как системы информационного менеджмента, электронных таблиц и программ для статистического и эконометрического анализа, геоинформационных систем. Начиная с 1980‐х годов документооборот муниципального управления, официальная статистика и другие формы данных о городе существовали преимущественно в цифровых форматах и обрабатывались и анализировались с помощью цифровых медиа. Однако эти массивы данных формировались (и отчасти продолжают формироваться) лишь время от времени и публиковались часто спустя месяцы после их генерирования.
В случае больших массивов данных, например подробных карт или переписей населения, новые исследования проводятся редко (раз в десять лет, если говорить о переписях) и могут быть опубликованы через полтора-два года после сбора данных, а иногда и позднее. В конкретных областях, таких как изучение дорожного движения или общественного транспорта, исследования проводятся раз в несколько лет на основе ограниченной пространственно-временной выборки. Лишь немногие массивы данных публикуются ежемесячно (как, например, информация об уровне безработицы) или ежеквартально (как, например, отчеты о ВВП), бóльшая часть данных обновляется раз в год, так как их сбор требует значительных усилий. Как правило, эти данные недостаточно подробны, охватывают лишь крупные регионы или страну в целом и имеют низкие возможности разукрупнения (например, разбивки по классам населения или секторам экономики). Когда сбор данных осуществляется чаще, например при спутниковой съемке, муниципальные власти из‐за лицензионных расходов приобретают лишь отдельные снимки. В других случаях, таких как потребительские покупки (отчеты о которых можно получить, анализируя транзакции по кредитным картам), данные в основном хранятся в зашифрованном виде в финансовых учреждениях. Другими словами, хотя с 1980‐х по 2000‐е годы муниципальным администрациям и представителям правительственных структур был доступен определенный спектр цифровых данных о городе, а вместе с ним и все более современное программное обеспечение (например, GIS) для их обработки, источники данных были ограничены в пространстве, времени и областях применения.
Таблица 1. Сравнение понятий «малые» и «большие» данные [110] Kitchin R. The real-time city? Big data and smart urbanism // GeoJournal. 2014. Vol. 79. № 1.
После 2000 года ландшафт городских данных изменился, произошли значительные трансформации как в природе данных, так и в способах их производства, а именно – переход от малых к большим данным. Это означает, что производство данных становится непрерывным, обеспечивает полное покрытие в рамках одной системы, характеризуется высоким разрешением, связностью и подвижностью (см. таблицу 1 ) и охватывает различные сферы [111] P. 1–14.
. Ситуация относительного недостатка данных сменяется их переизбытком. Это в первую очередь относится к оперативным городским данным, поскольку традиционная инфраструктура города, включая транспорт (шоссе, железные дороги, автобусные маршруты, а также транспортные средства) и коммунальные службы (электроэнергия, вода, свет), превратилась в цифровую сеть, снабженную системами встроенных датчиков, механизмов управления, сканирующих устройств, приемоответчиков, камер, счетчиков и систем GPS, производящих непрерывный поток данных о состоянии и использовании инфраструктуры (и образующих интернет-вещей). Многие из этих систем производят персонифицированные данные, отслеживая проездные документы отдельных пассажиров, номерные знаки автомобилей, идентификаторы мобильных телефонов, лица и походку, автобусы/поезда/такси, показания счетчиков и т. п. [112] Dodge M., Kitchin R. Codes of life: Identification codes and the machine-readable world // Environment and Planning D: Society and Space. 2005. Vol. 23. № 6. P. 851–881.
Все это совмещается с «большими данными», генерируемыми коммерческими компаниями, такими как операторы мобильной связи (местоположение, использование приложений), сайтами о путешествиях и гостиницах (отзывы), социальными медиа (мнения, фотографии, персональная информация, местоположение), поставщиками транспортных услуг (маршруты, пассажиропотоки), владельцами сайтов (история действий пользователей), финансовыми учреждениями и сетями розничной торговли (покупки), частными системами наблюдения и охранными предприятиями (местоположение, поведение), которые все чаще продают или отдают в лизинг свои данные, используя дата-брокеров, или открывают свои данные при помощи API (как в случае с Twitter или Foursquare). Большие данные также генерируются с помощью краудсорсинга (в таких проектах, например, как Open Street Map) и проектов гражданской науки (например, при помощи персональных метеостанций), когда люди общими усилиями создают информационный ресурс или собирают данные, будучи волонтерами. Другие виды данных, собираемые менее систематически, включают цифровую аэрофотосъемку с самолетов или беспилотных устройств, географическую видеосъемку, использование технологии LiDAR (световое обнаружение и ранжирование), тепловые и другие способы электромагнитного сканирования местности, позволяющие создавать 2D- и 3D-карты в реальном времени. И если официальной статистике в основном еще только предстоит пережить информационную революцию [113] Kitchin R. The opportunities, challenges and risks of big data for official statistics // Statistical Journal of the International Association of Official Statistics. 2015. Vol. 31. № 3. P. 471–481.
, то использование онлайн-транзакций электронного правительства (e-government), в которых цифровые данные производятся в момент завершения операции, уже изменило способы сбора данных, практикуемые городскими администрациями.
Читать дальше