Андреас Вайгенд - BIG DATA. Вся технология в одной книге

Здесь есть возможность читать онлайн «Андреас Вайгенд - BIG DATA. Вся технология в одной книге» — ознакомительный отрывок электронной книги совершенно бесплатно, а после прочтения отрывка купить полную версию. В некоторых случаях можно слушать аудио, скачать через торрент в формате fb2 и присутствует краткое содержание. Год выпуска: 2018, ISBN: 2018, Издательство: Литагент 5 редакция, Жанр: Базы данных, Прочая околокомпьтерная литература, Справочники, popular_business, на русском языке. Описание произведения, (предисловие) а так же отзывы посетителей доступны на портале библиотеки ЛибКат.

BIG DATA. Вся технология в одной книге: краткое содержание, описание и аннотация

Предлагаем к чтению аннотацию, описание, краткое содержание или предисловие (зависит от того, что написал сам автор книги «BIG DATA. Вся технология в одной книге»). Если вы не нашли необходимую информацию о книге — напишите в комментариях, мы постараемся отыскать её.

Информация как таковая становится самой значительной отраслью экономики, и базы данных знают о каждом конкретном человеке больше, чем известно ему самому. Чем больше информации о каждом из нас попадает в базы данных, тем в меньшей степени мы существуем.

BIG DATA. Вся технология в одной книге — читать онлайн ознакомительный отрывок

Ниже представлен текст книги, разбитый по страницам. Система сохранения места последней прочитанной страницы, позволяет с удобством читать онлайн бесплатно книгу «BIG DATA. Вся технология в одной книге», без необходимости каждый раз заново искать на чём Вы остановились. Поставьте закладку, и сможете в любой момент перейти на страницу, на которой закончили чтение.

Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать
СОЦИАЛЬНЫЕ ДАННЫЕ САМОЕ ЦЕННОЕ СЫРЬЕ XXI ВЕКА НОВАЯ НЕФТЬ Сетевым - фото 11
СОЦИАЛЬНЫЕ ДАННЫЕ —
САМОЕ ЦЕННОЕ СЫРЬЕ
XXI ВЕКА,
НОВАЯ НЕФТЬ
Сетевым дискуссионным форумам вроде Reddit пришлось разбираться с этими - фото 12

Сетевым дискуссионным форумам вроде Reddit пришлось разбираться с этими недостатками анонимности с помощью машинного обучения. На Reddit имена пользователей могут быть и постоянными, применяемыми во взаимодействии с сообществом, и одноразовыми – для единственного комментария или голосования. Каждый псевдоним получает полную свободу самовыражения, что стимулирует людей примерять разнообразные личности, выступая на платформе. Пользователей никогда не просят привязывать аккаунты к адресам электронной почты или реальным именам: создатели сайта не хотят взывать к ответственности пользователей за свои действия такими способами. Ответственность регулируется иначе. Интересный пост привлекает внимание, с ним соглашаются или спорят, добавляют комментарии или голосуют «за» и «против» уже опубликованных. Если пост или комментарий получает достаточно много голосов «против», он постепенно исчезает со страницы, уходит в самый низ рэнкинга и попадает в категорию «оценка ниже уровня», хотя при желании его можно найти и просмотреть. Сайт не выводит из обсуждения комментарии под псевдонимом, а позволяет пользователям поддерживать диалог по существу и решать, какие комментарии заслуживают их внимания, а какие нет.

Для Reddit в первую очередь важно то, что огромному числу разных людей действительно интересно содержание дискуссий на «горячих», «набирающих обороты» и «скандальных» страницах сайта, а не «официальное» авторство. Дискуссии, попадающие в список двадцати пяти топовых тем на этих страницах, обычно вызывают пристальное внимание всего интернета. Чтобы снизить уровень «фальсификаций при голосовании», когда одни и те же люди выступают под разными именами не для того, чтобы высказаться, а для того, чтобы «заплюсовать» свои посты и «заминусовать» чужие, в Reddit не стали тратить кучу денег и времени на модераторов, следящих за соблюдением порядка, а положились на машинное обучение. Когда одновременно появляется множество активных псевдонимов, идущих с одного IP-адреса или пишущих в одинаковом стиле, их «объединяют в одно производство» как «соучастников». Голоса, поданные «соучастниками», имеют меньший вес, а иногда просто игнорируются.

Честные сигналы

В 2016 году более 100 миллионов человек обратились к приложениям или интернет-сайтам в поисках знакомств для легких связей, любовных встреч или долговременных отношений. Требуется найти человека, которому нужно то, что предлагается, и обладающего тем, что нужно, и – само трудное – проявляющего ответный интерес.

В том, что касается знакомств, некоторые люди время от времени бывают кое в чем правдивы. Уровень правдивости варьируется в зависимости от характера человека и от ситуации. Иногда люди просто экспериментируют, чтобы понять, чего они хотят на самом деле. Разговоры – это одно. То, что человек делает, – другое. Сигналы, которые следуют из фактических поступков людей, социологи назвали «честными сигналами».

Дизайн пользовательского интерфейса приложения знакомств и разработка алгоритмов рекомендаций – особенно трудная задача, поскольку пользователь может «официально» считать привлекательными одни черты, а характер его работы с сайтом свидетельствовать о совершенно других предпочтениях. Один из создателей сайта OkCupid Кристиан Руддер доказал, что пользователи могут не полностью осознавать свои расовые и этнические предпочтения или не желать в них признаваться [123]. Но простой подсчет кликов и запросов о контакте быстро выявляет такие предпочтения.

Это несколько напоминает старую проблему с оценками кинофильмов. Когда Netflix просит пользователей высказать мнение о фильмах, получивших высокую оценку критиков, вроде игрового «Гражданина Кейна» или документального «Черного плавника», огромная часть людей выставляет им «пятерки», будучи уверены, что они обязаны оценить их именно так: ведь «все» сказали, что это отличное кино. Netflix может рекомендовать клиенту фильмы на основе его оценок, но это имеет смысл только в случае, если это честные оценки. Но люди должны убедиться в том, что правдивые ответы – в их собственных интересах. В Netflix пришли к выводу, что самым честным сигналом об интересе к определенному жанру кино является продолжительность стримминга видео до момента выхода из него. Другими словами, для составления рекомендаций данные о просмотрах полезнее, чем данные об оценках фильмов [124]. Профессор социальной психологии Мичиганского университета Ричард Нисбетт утверждает, что люди часто не понимают когнитивные процессы, определяющие их поступки и решения. Наши способности к самопознанию и самонаблюдению достаточно ограничены [125].

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Похожие книги на «BIG DATA. Вся технология в одной книге»

Представляем Вашему вниманию похожие книги на «BIG DATA. Вся технология в одной книге» списком для выбора. Мы отобрали схожую по названию и смыслу литературу в надежде предоставить читателям больше вариантов отыскать новые, интересные, ещё непрочитанные произведения.


Отзывы о книге «BIG DATA. Вся технология в одной книге»

Обсуждение, отзывы о книге «BIG DATA. Вся технология в одной книге» и просто собственные мнения читателей. Оставьте ваши комментарии, напишите, что Вы думаете о произведении, его смысле или главных героях. Укажите что конкретно понравилось, а что нет, и почему Вы так считаете.

x