Краудсорсинг и Интернет вещей в будущем могут коснуться самых разнообразных сфер и глубоко и по-разному затронуть жизни людей. «Технологический прогресс… уничтожает барьеры, ранее отделявшие любителей от профессионалов. Любители и дилетанты вдруг получили рынок для результатов своей деятельности, на котором организации подключаются к скрытым талантам людей», – отмечает Джефф Хау, который ввел этот термин и выпустил в 2006 г. книгу «Краудсорсинг. Коллективный разум как инструмент развития бизнеса» [7] Хау Дж. Краудсорсинг. Коллективный разум как инструмент развития бизнеса. – М.: Альпина Паблишер, 2014.
{10} 10 June 2006 issue of Wired : http://archive.wired.com/wired/archive/14.06/crowds.html .
. Хау рассматривает краудсорсинг как способ подключиться к знаниям и опыту, которые раньше было невозможно получить и проанализировать.
Городские органы власти выпускают приложения, которые позволяют жителям сообщать с помощью смартфона о выбоинах на дороге или иных проблемах. Агентства по оказанию помощи пострадавшим используют краудсорсинг, чтобы лучше понимать, как распределять ресурсы. Например, появившаяся в 2008 г. программная платформа Ushahidi, совместно созданная разработчиками из Кении, Ганы, Южно-Африканской Республики, Малави, Нидерландов и США, позволяет добровольцам по всему миру наносить на карту любые события, от стихийных бедствий до политических волнений. В результате получается замысловатый гибрид с визуализацией в реальном времени, геолокационными данными и высокотехнологичными функциями коллективной картографии.
Все эти возможности заставляют переосмыслить традиционные методы сбора и использования данных. Благодаря Интернету и удешевлению технологий – включая смартфоны – барьеры на пути к подключению и подключаемости рухнули, равно как и затраты на сбор и передачу данных от тысяч и миллионов людей или устройств. Процесс, для которого в прошлом потребовались бы тонны бумаги, услуги наземной почты и месяцы на сведение данных в таблицы, теперь занимает считаные секунды, причем результаты расчетов динамически меняются в зависимости от условий и характеристик.
Большие данные – большие результаты
Неудивительно, что различные микрочипы и датчики, а также человек со смартфоном или планшетом генерируют огромное количество данных. Наряду с существующими источниками (у многих организаций есть унаследованные базы данных и регистрационные записи, хранящиеся десятилетиями) сейчас имеется множество новых способов их получения. В целом объемы данных ежегодно увеличиваются приблизительно на 50–60 %, а мобильный трафик растет примерно на 61 % в год, согласно данным сетевого гиганта Cisco Systems {11} 11 Cisco Visual Networking Index: Global Mobile Data Traffic Forecast Update, 2013–2018. http://www.cisco.com/c/en/us/solutions/collateral/service-provider/visual-networking-index-vni/white_paper_c11–520862.html .
. По прогнозам International Data Corporation, к 2020 г. в мире будет существовать 40 зеттабайт данных. (Для справки: 1000 терабайт = 1 петабайт, 1000 петабайт = 1 эксабайт, и 1000 эксабайт = 1 зеттабайт. В один зеттабайт поместится примерно 250 млрд DVD-дисков, то есть более 35 лет непрерывного просмотра видео в высоком качестве). Это приблизительно 6 терабайт на каждого живущего ныне человека – или 3 млн книг на душу населения {12} 12 http://www.siemens.com/press/pool/de/feature/2014/corporate/heuring-factsheet-en.pdf .
.
Неудивительно, что различные микрочипы и датчики, а также человек со смартфоном или планшетом генерируют огромное количество данных. Наряду с существующими источниками (у многих организаций есть унаследованные базы данных и регистрационные записи, хранящиеся десятилетиями) сейчас имеется множество новых способов их получения.
Несмотря на то что словосочетание «большие данные» представляет собой профессиональный жаргонизм, это разумная концепция, в основе которой лежит сбор, хранение и использование наборов данных, полученных как из структурированных, так и из неструктурированных источников (первые – это базы данных). Большие данные обычно существуют в виде потоков сообщений, текстовых файлов, фотографий, видео– и аудиозаписей, социальных медиа. Дуг Лейни, ныне аналитик в компании Gartner, еще в 2001 г. дал короткое и внятное определение больших данных. Он заявил, что большие данные включают три основные компонента: объем, скорость и разнообразие. Объем относится к количеству данных, скорость – к тому, на какой скорости данные генерируются и становятся доступными для использования, разнообразие означает множество различных типов существующих данных.
Читать дальше
Конец ознакомительного отрывка
Купить книгу