Вот он и дал своим ребятам строгий наказ: вести себя тише воды, ниже травы, но держать глаз и ухо востро – и не упускать ничего, что могло бы подсказать полезное решение, как прогнозировать пожары. «Мы внимательно выслушивали пожарных, полицейских, инспекторов строительного надзора, управления по охране и развитию жилищного фонда, управления водоснабжения. Вопрос всем задавался один и тот же: „Вот вы прибываете на объект – и сразу видно, что это трущоба, бывает так? И по каким ключевым признакам это видно?“ И мы слушали, слушали и слушали их ответы…» – И постепенно вырисовалась закономерность. Самыми пожароопасными, как удалось выяснить ребятам, оказались жилые дома, возведенные до 1938 года, когда в Нью-Йорке были ужесточены строительные нормы и правила. Расположены они обычно в беднейших кварталах, часто относятся к арестованному недвижимому имуществу просрочивших ипотечные кредиты домовладельцев, а также являются рассадником всевозможных грызунов и паразитов, на что регулярно жалуются жители соседних домов [29] Thor Olavsrud , How Big Data Saves Lives in New York City, CIO , October 25, 2012.
.
Соответственно, ребята Флауэрса принялись поднимать данные по такого рода вопросам. Оказалось, что дело это на удивление непростое. Это в теории Нью-Йорк – золотая жила для любителей всевозможной статистики, поскольку там сорок с лишним управлений и служб напрямую подчинены мэрии и десятилетиями отчитываются перед ней о проделанной работе, сообщая, в частности, детальные цифровые показатели. Чиновники мэрии так гордились этими залежами данных, что Блумберг, когда он согнал их всех в один большой загон, распорядился развесить по стенам – прямо между историческими картинами маслом – плазменные панели для отображения столь любимых здешними обитателями статистических показателей. Но вот незадача: нужная информация хранилась в десятках разрозненных баз данных, причем они велись отдельно не только каждым управлением, но и каждым структурным подразделением! Цифры оказались настолько же фрагментированными, как и человеческие ресурсы.
По базе данных учета поступлений налогов на землепользование PLUTO [30] Данные PLUTO см.: http://www.nyc.gov/html/dcp/html/bytes/applbyte.shtml
ребята составили выборку из 640 000 малоэтажных нью-йоркских домов, в каждом из которых, по регистрационным данным мэрии, проживало от одной до трех семей. Из-за причудливости законов города Нью-Йорка Управление пожарной охраны отвечало за проверку противопожарной безопасности примерно половины из них; вторую половину контролировало Управление жилищного строительства. Ребятам, однако, удалось поднять из архивов обоих управлений (опять же раздельных!) все данные и о пожарах в жилых домах, и о поступивших жалобах на незаконные перепланировки. Кроме того, они выудили из Финансового управления и Следственного управления (первое занималось налогами, второе – финансовыми махинациями) информацию о ранее выявленных невыплатах налогов и ипотечных кредитов и сверили ее с полученным из Управления жилищного строительства списком жилых домов, построенных до 1938 года. Наконец, данные из всех источников были ими сведены в единый массив и подвергнуты статистической обработке. Постепенно стала вырисовываться закономерность. По адресам, где присутствовали все четыре фактора риска одновременно, и пожары и несанкционированные перепланировки случались с пугающей частотой, вне зависимости от того, поступали на эти дома жалобы или нет. Иными словами, дома, являющиеся потенциальными огненными ловушками для своих жильцов, нужно выявлять не по сигналам на горячую линию 311 и не по письменным жалобам на безобразное противопожарное состояние и антисанитарию. Неблагополучные адреса узнаваемы по сочетанию четырех характерных, хотя и разнородных признаков: просроченная ипотека; нарушение строительных норм и правил; старая застройка; общая бедность квартала, определяемая по совокупности всех ее проявлений.
С этими данными Флауэрс, заручившись поддержкой Голдсмита, отправился к инспекторам Управления жилищного строительства и попросил провести адресную проверку выявленных домов, построенных с нарушением строительных норм и правил и, в целом, неблагополучных по совокупности проанализированных данных. «Поначалу идея им совсем не понравилась, нас просто назвали чокнутыми, – вспоминает Флауэрс. – Но все-таки Управление жилищного строительства удалось взять измором, и инспектора отправились проверять адреса по нашим спискам». Результаты ошеломили. Традиционно по результатам проверок реальные проблемы у них выявлялись лишь по 13 % адресов. По новому методу нарушения были обнаружены в 70 % случаев [31] Kenneth Cukier and Viktor Mayer-Schoenberger , The Rise of Big Data, Foreign Afairs, May 1, 2013. См. также: Cukier and Mayer-Schoenberger , Big Data: A Revolution That Will Transform How We Live, Work, and Think (Eamon Dolan: Mariner, 2014).
. Как по мановению волшебной палочки – и без дополнительных затрат – эффективность проверок соблюдения норм противопожарной безопасности выросла в четыре раза.
Читать дальше