Роль метаданных в анализе телеэфира

22 март 2017 15:35 #54470 от ICT
Что нужно сделать, чтобы ответь на три простых вопроса?   1. Какие самые рейтинговые по версии "Кинопоиска" и IMDb познавательные передачи выходили в эфир на всех каналах, вещающих в России и странах СНГ, за последние полтора года?   2. Сколько выходов было у каждой передачи?   3. Когда и на каком канале каждая из них впервые вышла в эфир?   Время для сбора информации непосредственно от телеканалов упущено, поэтому для начала нужно найти источники, в которых есть телепрограмма по всем каналам. Да еще и за такой длительный период. Затем придется определить контент для каждого эфирного события. Причем названия одного и того же контента на каналах могут различаться, быть на разных языках или оказаться вплетены в описание эфира, когда сложно понять, где название самого контента, а где название его серии или другая вспомогательная информация. А ведь нужно точно идентифицировать этот контент без создания дублей. Каждую неделю на 1,4 тыс. каналах (это все каналы, вещающие в интересующих нас странах) в среднем 340 тыс. эфирных событий. Умножаем на 80 недель и получаем 27 млн 200 тыс. эфирных событий, которые нужно идентифицировать. К счастью, описания эфирных событий на каналах повторяются и оригинальных описаний всего 1 млн 360 тыс. Далее для всего полученного контента, а это 160 тыс. уникальных единиц, нужно определить, относится он к категории познавательного или нет, так как нас интересует не весь контент, а лишь определенная категория. И затем останется только определить рейтинг для 8,5 тыс. познавательных передач. Если на определение эфирного события тратить 30 секунд, на определение категории контакта 30 секунд, а на определение рейтинга контента 2 минуты (по 1 минуте на каждый), общие трудозатраты будут такими: 11330 + 1330 + 283 = 12 940 чел./час. Примерно 4 млн рублей... И это с учетом того, что у нас уже имеется ИТ инфраструктура, созданная специально под нашу задачу, так как на таблицах Exсel такая задача решается крайне неэффективно. К счастью, вся работа уже проделана, и мы готовы поделиться с вами полученными результатами.   Итак, первый вопрос был, какие самые рейтинговые, по версии "Кинопоиска" и IMDb, познавательные передачи выходили в эфир на всех каналах, вещающих в России и странах СНГ, за последние полтора года?     Второй вопрос: сколько выходов было у каждой передачи?     Третий вопрос: когда и на каком канале каждая из них впервые вышла в эфир?     Естественно, полученные и обработанные данные, а также наполненный нашими свойствами контент можно использовать и для ответов на многие другие вопросы. Пример на рейтингах — это малая часть набора метаданных, которыми можно наполнить полученный нами список уникальных передач. В частности, контент можно классифицировать по категории, жанру, теме, возрастной группе, полу, году выпуска, производителю и разным другим рейтингам. В итоге это дает массу шансов для быстрого анализа большого объема данных и, как следствие, возможность принимать своевременные и взвешенные управленческие решения. Ссылка на источник


  • Сообщений: 75474

  • Пол: Не указан
  • Дата рождения: Неизвестно
  • Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

    Похожие статьи

    ТемаРелевантностьДата
    «Билайн» научит менеджеров зарабатывать на анализе данных9.69Понедельник, 01 февраля 2016
    Владельцы «Пятерочки» и «Перекрестка» придумали, как заработать сотни миллионов на анализе логов9.39Среда, 19 сентября 2018
    Роль моделирования в развитии 5G8.53Среда, 28 октября 2020
    IDC определила роль «умных» МФУ в рабочей среде8.34Четверг, 14 января 2016
    Необычный робот возьмет на себя роль дворецкого в умном доме8.08Вторник, 14 июня 2016
    Россия укрепит лидирующую роль на рынке SVOD в Восточной Европе8.08Среда, 30 ноября 2016
    Конференция CNews «ITSM 2018: новая роль ИТ в цифровой компании»8.08Вторник, 21 августа 2018
    Эксперты обсудили еду будущего и роль технологий на X5Tech Future Night8.08Вторник, 15 декабря 2020
    Лидеры стран БРИКС отметили важную роль ИКТ в ходе расширенного заседания7.99Пятница, 10 июля 2015
    Какова роль вендора в проектах цифровой трансформации – расскажет «Диасофт» на конференции CNews7.91Понедельник, 01 апреля 2019

    Мы в соц. сетях