«Телеспутник» рассказал, как проводятся гибридные телеизмерения. Над интеграцией больших данных и традиционного панельного исследования работает «Агентство 2».
Компания исследует предпочтения аудитории оператора «Триколор», у которого развивается ОТТ-вещание (свыше 1,2 млн. пользователей по конечным итогам 2019 года) и растет база приемников с обратной связью.
Благодаря технологии Return Path Data (RPD, данные канала обратной связи) доступен большой объем информации о телесмотрении на ТВ-приставках операторов платного ТВ. Однако собранные таким способом данные можно эффективно использовать только при условии обогащения их иной аналитикой.
Использование больших данных превратилось в один из основных трендов в медийных и маркетинговых исследованиях. Они помогают нивелировать проблемы ограниченности размеров выборки, чтобы получить статистически означаемые данные о телесмотрении малых/нишевых каналов, а также фиксировать не беря в расчет просмотром линейных телеканалов просмотр по запросу и отложенный просмотр. Немаловажно, что сбор информации в масштабах такого подхода происходит пассивно, из этого видно, исключаются оплошности не нашего прихода респондентов.
Особенность подхода заключается в его гибкости и адаптивности, он позволяет анализировать любое телесмотрение на любой платформе, выпускать из рук любые очаги данных, не ограничиваясь привычными телевизорами. Это нужно будет в условиях динамично меняющейся жизни, при появлении новых коммуникационных платформ, а также с учетом сезонной динамики.
Большие данные обладают еще одним превосходством - существенно более невысокой стоимостью. Отсутствует длинная цепочка бизнес-процессов, включающих рекрутинг, установку оборудования, сбор социально-демографических сведений. Для сбора данных обратной связи необходимо только включение дополнительного функционала в систему устройства. Затраты требуются лишь на оборудование для хранения и обработку таких данных.
Несмотря на описанные превосходства, большие данные не являются универсальным решением всех проблем панельного метода. Из-за больших объемов в массивах RPD сплошным потоком гулов, искажений, которые важно тщательно отсеивать. Кроме того, у необработанных данных более невысокое качество при сравнении с панельными: нет социально-демографической информации о зрителях, не всегда можно определить, принадлежат ли несколько приемников одному домохозяйству, нет представления об однородности массивов (соотношение по полу, возрасту, доходу), ротация в такой базе намного интенсивнее, чем в панели с непрерывными участниками. Есть и технические сложности: нельзя безошибочно определить, кто из членов домохозяйства находится пред телевизором, глядят ли не детей крестить на самом деле, так как приемники обычно не выключаются пользователями.
Один из вариантов корректировки статистик - моделирование за счет самообучающихся систем на основании пиплметрической панели, о которой имеется полная информация. Так, например, поступают в Nielsen, одной из компаний - пионеров медиаизмерений, активно работающей с большими данными в разных категориях. Суть подхода состоит в тщательном отслеживании репрезентативности панели, которая используется как эталон, выявлении типичных паттернов поведения определенных групп зрителей и сравнении повадок телесмотрения зрителей выборки с неизвестными данными в RPD-массивах. В конечном счете выводится профиль аудитории по предпочитаемому контенту и способу его потребления.
При использовании самообучения система имеет возможность сравнить имеющиеся данные с накопленной ранее статистикой, чтобы фиксировать отклонения, ну а в будущем и прогнозировать тренды.