Андреас Вайгенд - BIG DATA. Вся технология в одной книге

Здесь есть возможность читать онлайн «Андреас Вайгенд - BIG DATA. Вся технология в одной книге» — ознакомительный отрывок электронной книги совершенно бесплатно, а после прочтения отрывка купить полную версию. В некоторых случаях можно слушать аудио, скачать через торрент в формате fb2 и присутствует краткое содержание. Год выпуска: 2018, ISBN: 2018, Издательство: Литагент 5 редакция, Жанр: Базы данных, Прочая околокомпьтерная литература, Справочники, popular_business, на русском языке. Описание произведения, (предисловие) а так же отзывы посетителей доступны на портале библиотеки ЛибКат.

BIG DATA. Вся технология в одной книге: краткое содержание, описание и аннотация

Предлагаем к чтению аннотацию, описание, краткое содержание или предисловие (зависит от того, что написал сам автор книги «BIG DATA. Вся технология в одной книге»). Если вы не нашли необходимую информацию о книге — напишите в комментариях, мы постараемся отыскать её.

Информация как таковая становится самой значительной отраслью экономики, и базы данных знают о каждом конкретном человеке больше, чем известно ему самому. Чем больше информации о каждом из нас попадает в базы данных, тем в меньшей степени мы существуем.

BIG DATA. Вся технология в одной книге — читать онлайн ознакомительный отрывок

Ниже представлен текст книги, разбитый по страницам. Система сохранения места последней прочитанной страницы, позволяет с удобством читать онлайн бесплатно книгу «BIG DATA. Вся технология в одной книге», без необходимости каждый раз заново искать на чём Вы остановились. Поставьте закладку, и сможете в любой момент перейти на страницу, на которой закончили чтение.

Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Спам-фильтры стараются найти настройки, позволяющие сбалансировать сортировку писем, часть которых по-прежнему ошибочно относят к спаму, а часть ошибочно относят к неспаму. В подавляющем большинстве случаев письма «удостаиваются» отправки в спам по некоторым признакам данных отправителя и метаданных всей почты, проходящей через серверы службы, благодаря чему машинное обучение становится возможным на сетевом уровне. Однако, чтобы усовершенствовать работу системы, провайдер мог бы сделать доступным анализ, на основе которого письмо отправилось в спам. Более того, вам могли бы предоставить возможность изучить правила и скорректировать их с учетом ваших личных предпочтений и особенностей коммуникации.

С одной стороны, если вам не хочется терять время на выявление спама вручную и вы не слишком переживаете по поводу возможности пропустить важное сообщение, можно было бы установить жесткие параметры фильтрации входящих писем. С другой стороны, если вы хотите быть уверены, что не пропустите важное сообщение, а необходимость потратить какое-то время на удаление спама вас не смущает, вы можете смягчить эти параметры. Если у вас куча родственников и друзей в Нигерии, вас уже давно перестало смущать, что уровень спама в электронных письмах из этой страны составляет 90 процентов [397]. Почему бы не предоставить людям больше возможностей для обратной связи с машинами, не дать расширить права пользователей при сортировке собственной почты? Чтобы сделать это, почтовым сервисам потребуется обнародовать критерии, применяемые ими для квалификации спама, и поделиться с пользователями контролем над обработкой сообщений, предоставив возможность корректировать некоторые параметры.

Расширение права пользователей на свободу выбора требует изменения в сложившейся расстановке сил путем наделения граждан большими правами в отношении информации и процессов ее переработки. Есть четыре основных способа расширить возможности контроля: право вносить исправления в свои данные, право на размытие данных о себе, право экспериментировать с обработкой своих данных и право переносить свои данные. Право вносить исправления в свои данные расширяет свободу выбора через свободу самовыражения, в то время как право на размытие данных о себе расширяет свободу выбора через свободу волеизъявления. Право экспериментировать с обработкой своих данных расширяет свободу выбора через расширение свободы исследований, в то время как право переносить свои данные расширяет свободу выбора через расширение свободы передвижения. Создание инструментов, в основу которых будут заложены эти четыре права, позволит совершенствовать информационные продукты и услуги и развивать экономику эпохи постприватности, в которой данные будут поставлены на службу людям.

Право вносить исправления в информацию

Примерно шесть тысяч лет назад с изобретением клинописи шумерами зародилось и делопроизводство. Созданием, высушиванием и сохранением глиняных табличек, которые служили этой цивилизации документами постоянного хранения, в основном занималась правящая элита царей-жрецов [398]. Таблички хранили сведения о том, кто чем владеет, кто сколько задолжал по налогам, оброку, займам или за товары [399], и о законах, регулирующих собственность и торговлю. Поскольку на кону стояло очень многое, имели место подделки и последующие конфликты по поводу того, что именно было «высечено на камне». Шумеры решили, что таблички должны храниться под замком, что обычно поручалось местному храму. Однако это означало, что информация контролируется по большей части жрецами – именно они решали, кому предоставить доступ к записям, а кому нет. Всем остальным оставалось надеяться на то, что жрецы корректно отразят информацию и не поддадутся искушению исказить вверенные их заботам данные. К несчастью, цари-жрецы и прочие представители элит не всегда были примером порядочности и благонадежности. Хранение информации было одним из способов концентрации власти [400].

Сооснователь стартапа в области распознавания изображений Jetpac Пит Уорден полагает, что мы сейчас вступили в очередной период чрезмерно интенсивных усилий по защите информации [401]. Проблема потенциального ущерба, который способна нанести неверная информация, налицо, и мы полагаем, что ее можно решить, обеспечив корректность всех имеющихся данных. Но в силу огромности количества информации, окружающей нас сегодня, защитить от искажения каждый ее бит и байт уже не представляется возможным. Шумеры, которых насчитывалось всего около миллиона человек, попытались сделать это, предоставив право контроля над архивами небольшому числу людей, и убедились, что информация все равно подвергается искажениям. Следить за достоверностью каждого элемента имеющегося объема информации также вне человеческих сил. Восточные немцы, которых насчитывалось около 16 миллионов человек, пробовали заниматься этим, завербовав в агенты Штази один процент трудоспособного населения, но быстро поняли, что ручная верификация данных не масштабируется. Тем не менее сегодня мы можем воспользоваться преимуществами машинного обучения для подтверждения факта достоверности информации и предоставления ее гражданам в ранжированном по релевантности виде.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Похожие книги на «BIG DATA. Вся технология в одной книге»

Представляем Вашему вниманию похожие книги на «BIG DATA. Вся технология в одной книге» списком для выбора. Мы отобрали схожую по названию и смыслу литературу в надежде предоставить читателям больше вариантов отыскать новые, интересные, ещё непрочитанные произведения.


Отзывы о книге «BIG DATA. Вся технология в одной книге»

Обсуждение, отзывы о книге «BIG DATA. Вся технология в одной книге» и просто собственные мнения читателей. Оставьте ваши комментарии, напишите, что Вы думаете о произведении, его смысле или главных героях. Укажите что конкретно понравилось, а что нет, и почему Вы так считаете.

x