— Брайан, Chicago Tribune
Рис 10. Список побед и поражений (Проект Chartball)
Одним из моих любимых примеров проектов из области журналистики данных является проект Эндрю Гарсиа Филипса (Andrew Garcia Phillips) под названием Chartball( Рис 10). Эндрю – великий фанат спорта, испытывающий при этом ненасытный аппетит к данным, умеющий создавать отличный дизайн и писать программные коды. В «Чартболле» он визуализирует не только размах истории, но и выдает детальную информацию об успехах и неудачах конкретных игроков и команд. Он создает контекст, делает приятную, пробуждающую интерес графику, его работа представляет собой глубокое исследование, она приятна и интересна – и при этом я не особо интересуюсь спортом!
— Сара Слобин, Wall Street Journal
Журналистика данных в перспективе
В августе 2010 года некоторые коллеги и я организовали то, что, как мы считаем, было первыми международными конференциями по журналистике данных, which took place in Amsterdam. At this time there wasn’t a great deal of discussion around this topic and there were only a couple of organizations that were widely known for their work in this area.
1. Они проходили в Амстердаме. В то время на эту тему не велось особых дискуссий, и была лишь пара организаций, которые были широко известны своими работами в данной области.
Способ, которым медийные организации, такие как Guardian и New York Times, обрабатывали огромные объемы данных, опубликованных WikiLeaks, стал одним из основных шагов, которые придали данному термину известность. Примерно в это время термин начал более широко использоваться, вместе с «компьютерной журналистикой», для того, чтобы описать, как журналисты используют данные для улучшения качества освещения событий и увеличения числа глубоких исследований на заданную тему.
Общаясь с опытными журналистами данных и учеными в области журналистики в Twitter, приходишь к выводу, что одна из самых ранних формулировок того, что мы ныне признаем журналистикой данных, была дана в 2006 году Эдрианом Головатым (Adrian Holovaty), основателем проекта EveryBlock – информационной службы, которая позволяет пользователям искать и находить то, что произошло в их районе, в их квартале. В своем коротком эссе под названием «Фундаментальный путь, которым должны измениться газетные сайты» ( «A fundamental way newspaper sites need to change»)он заявляет, что журналисты должны публиковать структурированные, машиночитаемые данные, вместе с традиционными «большими массами текста»:
Например, предположим, в газете опубликована печатная заметка о местном пожаре. Если есть возможность прочитать эту статью на сотовом телефоне – это здорово и прекрасно, просто щегольски. Ура, технологии! Но что я действительно хочу, чтобы было возможно сделать, так это изучить исходные данные этой истории, один за другим, со всеми слоями атрибуции и ссылок на источники, с инфраструктурой для сравнения данных пожара – даты, времени, места, жертв, номера пожарной части, расстояния от пожарной части, имен и уровня опыта пожарных на месте события, времени, которое потребовалось пожарным для того, чтобы прибыть на место происшествия – с подробными данными о предыдущих пожарах. И последующих пожаров, когда/если они произойдут.
Но что отличает это от других форм журналистики, которые используют базы данных или компьютеры? Как – и до какой степени – журналистика данных отличается от других форм журналистики прошлого?
«Компьютерная журналистика» и «точность журналистики»
Использование данных для улучшения репортажей и предоставления структурированной (если не машиночитаемой) информации общественности имеет долгую историю. Возможно, наиболее непосредственное отношение к тому, что мы сейчас называем журналистикой данных, имеет «компьютерная журналистика» (computer–assisted reporting – CAR), которая была первым организованным, систематическим подходом к использованию компьютеров для сбора и анализа данных для улучшения новостей.
CAR впервые была использована в 1952 году CBS для предсказания результатов президентских выборов. С 1960–х годов журналисты (в основном, занимавшиеся расследовательской журналистикой, и в основном из США) стремятся независимым образом контролировать власть путем анализа баз данных по информации из открытых источников научными методами. В рамках этого подхода, также известного как «журналистика общественного служения», сторонники этой журналистской техники, реализуемой при помощи компьютера, стремились выявлять тенденции, развенчивать общеизвестные истины или заблуждения и раскрывать данные о всяческих несправедливостях, творимых государственными властями или частными корпорациями. Например, Филип Мейер (Philip Meyer) пытался развенчать общепринятую трактовку беспорядков 1967 года в Детройте – чтобы показать, что в них участвовали не только малообразованные южане. Сюжеты Билла Дедмена (Bill Dedman) из серии «Цвет денег» в 1980–е годы раскрывали информацию о систематических расовых предрассудках в кредитной политике ведущих финансовых институтов. В своей работе «Что пошло не так» Стив Дойг стремился проанализировать ущерб от урагана «Эндрю» в начале 1990–х годов, чтобы понять, в какой степени на силу этого ущерба оказали влияние недостатки в области политики и практики городского развития. Репортажи на основе данных стали ценной общественной работой и позволили журналистам завоевать известные награды.
Читать дальше