ЕАИС
Единая федеральная автоматизированная информационная система сведений о показах фильмов в кинозалах (ЕАИС) 22 22 http://ekinobilet.ru
создана во исполнение поручения Президента Российской Федерации Министерством культуры Российской Федерации. Назначение указанной системы состоит в сборе, учёте и обработке сведений о публичной демонстрации кинофильмов в кинозалах российских кинотеатров. Получение достоверных сведений о показе отечественных фильмов является необходимым инструментом для совершенствования предусмотренных законодательством мер государственной поддержки кинематографии, таких как частичное государственное финансирование производства, проката и показа национальных фильмов. Такая система на сегодняшний день может стать единственным достоверным источником сведений об эффективности государственной поддержки тех или иных групп проектов и оказать существенное влияние на процесс развития отечественной кинематографии путем защиты экономических интересов участников создания и продвижения аудиовизуальной продукции.
Вместе с решением поставленных государством задач система призвана оказать посильную помощь в развитии кинобизнеса в России. В частности, с помощью системы предлагается, с одной стороны, упростить взаимодействие участников кинорынка путём принятия на себя функций предоставления статистической отчетности от кинотеатров прокатчикам, а с другой стороны, увеличить эффективность работы их аналитических служб, что, в свою очередь, может служить дополнительным фактором развития бизнеса. Формы отчетности в Системе аналогичны внутренним формам прокатчиков и, при необходимости, могут дополняться или изменяться.
Сбор данных
Для сбора данных из перечисленных источников был разработан 23 23 Комплекс программ был разработан Владимиром Белоусовым в ходе подготовки магистерской диссертации под руководством А. Н. Козырева.
уникальный комплекс программ, состоящий из четырех модулей:
Модуль Аз
Сканирующая программа (crawler), работающая через веб-интерфейс. Собирает информацию о раздачах на трекерах и дает указания модулю Буки.
Модуль Буки
Программа, работающая по протоколу BitTorrent. Собирает информацию об участниках раздач.
Модуль Веди
Выполняет все остальные функции по сбору данных: просматривает афишу, рейтинги и данные о кассовых сборах.
Консолидатор
Объединяет базы данных от всех модулей в одну, обрабатывает и очищает данные.
Программный комплекс разработан с использованием современной технологии Microsoft. NET, что позволяет запускать его практически под любой компьютерной операционной системой.
Описание данных
После обработки (агрегирования и фильтрации) собранные данные имеют следующий вид:
1) Таблица Films – список фильмов (без повторений)
• Film Id
• Название
• Год
• Дата премьеры в России
• Перечисление жанров фильма
• Дистрибьютор
Всевозможные рейтинги (КиноПоиск, IMDb, ожидание, рейтинг кинокритиков Rotten Tomatoes и пр.).
2) Таблица Torrents – список раздач
• Torrent Id
• Film Id
• Название трекера
• Качество видео по шкале от 0 (наихудшее) до 9 (наилучшее)
• Размер в байтах
• Дата создания
• Статус раздачи (открыта / закрыта, …)
3) Таблица Dynamics – динамика закачек
• Torrent Id
• Номер недели
• Всевозможные данные о количествах скачиваний, доступности кинотеатров, фильма и т. п.
4) Таблица Box Office – кассовые сборы
• Film Id
• Номер недели проката
• Данные о кассовых сборах, числе проданных билетов и количестве легальных копий.
5) Табллица Peers – список качающих / раздающих пользователей
• Peer Id
• Местонахождение пользователя с точностью до города
6) Таблица Downloads
• Torrent Id
• Peer Id
• Продолжительность присутствия в минутах.
Таким образом, по результатам пилотного сбора данных стали доступны сведения о 11 387 фильмах ( 113 из них шли в кинотеатрах в исследуемый период), которые находились в 22 670 раздачах на двух трекерах. 36%раздаваемых фильмов – одинаковые между трекерами. Всего было скачано 26 726 535 видеофайлов, из них 18 598 358 через Rutracker.org и 8 128 177 через tfile.ru .
Анализ данных
Статистические распределения приведены в таблице 1.2.
В среднем, пользователь находится в раздаче около 16 часов (показатель сильно варьируется). Сюда входит время скачивания файла и время отдачи этого файла.
Читать дальше