Андреас Вайгенд - BIG DATA. Вся технология в одной книге

Здесь есть возможность читать онлайн «Андреас Вайгенд - BIG DATA. Вся технология в одной книге» — ознакомительный отрывок электронной книги совершенно бесплатно, а после прочтения отрывка купить полную версию. В некоторых случаях можно слушать аудио, скачать через торрент в формате fb2 и присутствует краткое содержание. Год выпуска: 2018, ISBN: 2018, Издательство: Литагент 5 редакция, Жанр: Базы данных, Прочая околокомпьтерная литература, Справочники, popular_business, на русском языке. Описание произведения, (предисловие) а так же отзывы посетителей доступны на портале библиотеки ЛибКат.

BIG DATA. Вся технология в одной книге: краткое содержание, описание и аннотация

Предлагаем к чтению аннотацию, описание, краткое содержание или предисловие (зависит от того, что написал сам автор книги «BIG DATA. Вся технология в одной книге»). Если вы не нашли необходимую информацию о книге — напишите в комментариях, мы постараемся отыскать её.

Информация как таковая становится самой значительной отраслью экономики, и базы данных знают о каждом конкретном человеке больше, чем известно ему самому. Чем больше информации о каждом из нас попадает в базы данных, тем в меньшей степени мы существуем.

BIG DATA. Вся технология в одной книге — читать онлайн ознакомительный отрывок

Ниже представлен текст книги, разбитый по страницам. Система сохранения места последней прочитанной страницы, позволяет с удобством читать онлайн бесплатно книгу «BIG DATA. Вся технология в одной книге», без необходимости каждый раз заново искать на чём Вы остановились. Поставьте закладку, и сможете в любой момент перейти на страницу, на которой закончили чтение.

Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Право на исправление приобретает особую важность, когда информация может вам навредить. Например, по данным геолокации, в определенный момент времени вы находились в Нью-Джерси, хотя на самом деле были на Манхэттене, просто ваш телефон был привязан к базовой станции на другом берегу Гудзона. Потом по какой-то причине вам требуется подтвердить, где именно вы тогда находились. Вы можете поискать другие данные, например видеозапись, свидетельствующую, что вы были в Нью-Йорке, и приобщить ее к данным геолокации, чтобы другие смогли убедиться в противоречивости имеющейся информации. В будущем неконтролируемые вами данные, такие как видеозаписи из общественных мест, смогут использоваться для определения вашего соответствия требованиям потенциального работодателя или банка-кредитора. Помешать формированию таких данных невозможно, но можно настаивать на возможности дополнить их другими.

Кроме того, у вас должна быть возможность разместить корректирующую информацию (в виде опровержения, пояснения или оговорки) таким образом, чтобы она была в первую очередь видна любому, кто будет просматривать данные, и располагалась выше правок других людей. Далее, поскольку информация о вас может одновременно являться и информацией о других, вам должен быть предоставлен способ подчеркнуть, насколько важна для вас поправка, чтобы инфопереработчики могли определить, как ранжировать и показывать ее другим. Если размещение и приоритезация поправок не будут связаны с какими-то издержками, социальные сети очень скоро будут завалены ими. Чтобы этого не произошло, можно ввести суррогатную плату, предоставив каждому пользователю определенное количество баллов на размещение поправок.

Поправкам могут также присваиваться различные веса в зависимости от степени признания их корректности, включая наличие подтвержденного источника информации и обратной связи других пользователей. Из главы 2 мы знаем, что Reddit разрешает пользователям судить о достоинствах постов голосами «за» или «против» контента и идентифицирует тех, кто пытается обмануть систему, засекая голоса, исходящие от одного пользователя или группы по признаку одинаковых IP-адресов. Голоса «за» или «против» являются дополнением к информации. Но интернет-тролль может задеть или испортить репутацию человека или сетевого сообщества с единственной целью разозлить пользователей. Одним из способов поддержания здоровой экосистемы является требование идентификации каждого дополнения настоящим именем или постоянным псевдонимом. Но и тут не все так просто и однозначно. Ведь постоянный идентификатор гарантирует достоверность правки не больше, чем обещание свидетеля в суде «говорить правду и только правду» гарантирует правдивость его показаний. К тому же такая привязка к личности некорректна в отношении разоблачителей нарушений закона и гражданских прав, для которых идентификация личности может представлять угрозу жизни. Недавние примеры – WikiLeaks, публикующий правительственные документы, Панамский архив с информацией об уклонении от налогов [404]и LaborLink, описывающий условия труда на производстве [405].

Для оценки корректности исправлений можно использовать их метаданные, например время и место их создания. Видео– и аудиозаписи содержат фоновые шумы, по которым определяется частота электрического тока. В США, ЕС и Китае стандартная частота переменного тока различна. Но во всех случаях она незначительно варьируется в зависимости от нагрузки на электросеть, и этого достаточно, чтобы привязать эти колебания к конкретному месту и времени с точностью до минуты. Так, у каждой из четырех основных электросетей США и Канады есть свой особый «частотный характер», реагирующий на базовую нагрузку [406]. Сопоставив колебания фонового частотного шума записи с характерными колебаниями частот всех сетей, можно с высокой долей вероятности установить день, время и местность записи [407].

Этот пример, показывающий, что в любых записях содержится неудаляемая информация, похож на концепцию блокчейна – учетной системы, созданной для криптовалюты биткойн [408]. В общих чертах блокчейн представляет собой бессрочную историю всех взаимодействий и операций, в том числе данные, содержащиеся в информации. Таким образом, вместе с любой информацией передается ее полная история, и ее нельзя разделить, подделать или уничтожить. Блокчейн регистрирует текущего владельца каждого биткойна и не дает возможности одновременно использовать один и тот же биткойн в разных транзакциях, даже несмотря на то что многие пользователи биткойна предпочитают присваивать своим «кошелькам» псевдонимы. Система организована таким образом, что каждая транзакция открыто регистрируется в рамках децентрализованного распределенного процесса, а знакомиться с записями и создавать новые может любой участник. В основе идеи лежит простой факт: как только единица информации получила распространение, ее невозможно уничтожить в экзистенциальном смысле, поскольку ее копии присутствуют во всех устройствах сети. Любой перевод и обмен прозрачны, и их можно отследить во времени. Более того, в блокчейн можно вписывать комментарии, создавая контекст транзакции [409].

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Похожие книги на «BIG DATA. Вся технология в одной книге»

Представляем Вашему вниманию похожие книги на «BIG DATA. Вся технология в одной книге» списком для выбора. Мы отобрали схожую по названию и смыслу литературу в надежде предоставить читателям больше вариантов отыскать новые, интересные, ещё непрочитанные произведения.


Отзывы о книге «BIG DATA. Вся технология в одной книге»

Обсуждение, отзывы о книге «BIG DATA. Вся технология в одной книге» и просто собственные мнения читателей. Оставьте ваши комментарии, напишите, что Вы думаете о произведении, его смысле или главных героях. Укажите что конкретно понравилось, а что нет, и почему Вы так считаете.

x