Многие еще помнят дискеты, распространенные в конце двадцатого века и вмещающие до 3 мегабайт, а бортовой компьютер современного автомобиля с автопилотом обрабатывает до гигабайта данных в секунду 7. Широкое развитие Интернета, компьютеров и смартфонов, ежедневно создающих и передающих огромные массивы информации, не позволяет процессу датификации замедлиться, а, наоборот, с каждым годом увеличивает его темпы.
Наиболее датифицированной сферой общественной жизни сейчас является поведение человека в Интернете, где действия каждого пользователя сохраняются, соотносятся с другими данными и анализируются — в первую очередь для предоставления релевантной рекламы, уже невозможной в наши дни без больших данных. Датификация распространяется и на остальной мир — перемещения, покупки, датчики в автомобилях, умная бытовая техника и многое другое. Ежедневно мы создаем и взаимодействуем с огромным количеством данных. Это при том, что период активной датификации только начался и пока что затрагивает далеко не все аспекты нашей жизни. Процесс датификации все новых сфер окружающего мира неумолимо продолжается. Если в 2018 году весь объем хранимой человечеством цифровой информации был равен чуть более 20 зеттабайтам,
то уже к 2025 году он вырастет более чем в 8 раз и достигнет 160 зеттабайт 8. Датификация производства или любой другой сферы жизнедеятельности позволяет обрабатывать полученную информацию в системе больших данных — извлекать прибыль, упрощать некоторые процессы, лечить людей, обманывать их... Все мы плаваем в море данных, и с каждым годом это море становится все больше. Именно датификация по-своему является основным локомотивом революции больших данных, каким в начале ХХ века была электрификация, позволяющая существенно увеличить производительность труда и облегчить жизнь человека. Кстати, второй по величине производитель программного обеспечения, корпорация Oracle, так и назвала большие данные: «Электричество двадцать первого века — новый вид энергии, которая трансформирует все, к чему прикасается, в бизнесе, правительстве и в личной жизни» 9.
Источник: IDC's Data Age 2025 study, sponsored by Seagate, April 2017
Вторым фактором революционных изменений является рост вычислительной мощности компьютеров.Давид Хаус из Intel, анализируя рост количества транзисторов
и увеличение тактовых частот процессоров, сформулировал закон, в целом продолжающий работать и сегодня, согласно которому производительность процессоров удваивается каждые 18 месяцев.
Кроме того, уже в обозримом будущем прогнозируется внедрение полноценного квантового компьютера 10, использующего явления квантовой суперпозиции и квантовой запутанности для обработки данных, что позволит сделать резкий рывок в производительной мощности вычислительной техники. Так, корпорация Google, выпустившая недавно 72-кубитный квантовый процессор, уже заявила, что ее открытия позволяют в самом ближайшем будущем достичь квантового превосходства 11.
Третий фактор представляет собой совокупность открытий в области искусственного интеллекта и машинного обучения,сокращающих сложность обработки большого количества информации. Параллельно с развитием мощностей вычислительной техники учеными создаются все более совершенные модели обработки информации, которые упрощают работу с данными, ускоряющими процесс и уменьшающими затраты на обработку больших объемов информации. Например, произошедший в 2012 году перелом, связанный с переосмыслением подхода к свёрточным нейронным сетям, позволил в разы увеличить скорость и улучшить качество машинного распознавания изображений, видео- и аудиоинформации, текста и т.д. Подобные нейронные сети сегодня находят применение в самых разных областях и показывают крайне высокую эффективность, позволяют по-новому рассмотреть, разобрать на составляющие и обработать изображения, видеозаписи, текст и многое другое. К примеру, уже в 2016 году нейронные сети научились распознавать изображения эффективнее человека 12. Развитие искусственного интеллекта позволяет заменить множество профессий 13и кардинально изменить сложившиеся в обществе социальные отношения. Искусственный интеллект позволяет быстро обрабатывать большие данные. А большие данные, в свою очередь, почти всегда необходимы для работы искусственного интеллекта. Классическим примером здесь является беспилотный автомобиль, получающий все большее распространение в развитых странах, чье обучение обеспечено результатами анализа данных, полученных с датчиков автомобилей навигационных систем и других источников. Здесь же стоит упомянуть «наукастинг» — технологию распознавания паттернов и анализа данных в реальном времени. Анализ больших данных позволяет предсказывать будущее с высокой долей вероятности. Сегодня наукастинг обычно ассоциируют со сверхточным прогнозом погоды, вроде системы погодного анализа Deep Thunder, которая позволяет дать тщательно локализованный анализ осадков в Нью-Йорке и Рио-де-Жанейро на несколько дней вперед, прогнозируя не только погоду, но и, например, где именно могут рухнуть линии электропередачи в результате снегопада или какие этажи пострадают от грядущего наводнения 14. Погода — это лишь одна из областей «наукастинга», находящаяся на самом виду. Опираясь на современный анализ данных, в перспективе наукастинг позволит предвидеть различные события практически в любой области, где датификация достигла необходимых для этого объемов.
Читать дальше