Картинка статьи
Кристина Устиноваредактор CyberBrain

Баттл моделей атрибуции на основе данных: Марков vs Шепли

Хотя существует множество подходов к маркетинговой атрибуции, использующей исторические данные для определения ценности канала, наиболее эффективными на 2023 год признаны алгоритмические модели Маркова и Шепли. Рассказываем, зачем компании внедряют атрибуцию в отделах аналитики и рекламы. В частности определимся, в чем преимущества и недостатки моделей и почему мы остановили свой выбор на векторе Шепли.

Data-driven модели атрибуции

Мы рассмотрим две алгоритмические модели, которые присваивают веса каждой точке взаимодействия на основе теории вероятности и кооперативных игр, модели на основе Цепей Маркова и Вектора Шепли соотвественно.

Модель Шепли основана на теории кооперативных игр и названа в честь Нобелевского лауреата Ллойда Шепли. Варианты Shapley value используются большинством современных рекламных поставщиков данных, которые работают на основе data-driven модели. Цепной подход Маркова к маркетинговой атрибуции в свое время приобрел популярность в сообществе data science ввиду своей доступности, модель названа в честь А. Маркова.

Модель Марков

Большая известность модели связана с высокой доступностью и относительной независимостью от имеющихся у компании ресурсов. В сети можно найти готовый пакет на языке R, который каждый может скачать и при минимальном знании SQL и R применить на своих заранее предобработанных данных.

Это всегда очень заманчиво, когда можно буквально со старта и с небольшими вложениями проверить, работает ли этот подход в случае с вашим бизнесом. Не нужно быть data-science специалистом, Data-инженером или DevOps в одном лице для того, чтобы на своих данных посчитать модель и получить результат. Для расчета не нужно уметь разворачивать отдельную инфраструктуру, будет вполне достаточно того, что есть у вашего компьютера. И если результаты покажутся весомыми, то внедрять ее полномасштабно для дальнейшей оптимизации работы отделов маркетинга и аналитики.

Первое, на что стоит обратить внимание, Марков воспринимает цепочку как набор действий, учитывая как позицию, так и последовательность всех элементов. Модель рассуждает следующим образом: изменится ли результат кампании, если убрать какое-то событие из цепочки? Затем смотрит на результат и оценивает вероятность того, повлияет ли это на итог кампании или нет. Далее поступательно проделывает этот алгоритм с каждым элементом и рассчитывает вероятность.

Обратим внимание на две проблемы модели Маркова. Часто в результате оценки медийным инструментам присваивается наибольшая ценность, поскольку а) в большинстве случаев выше оценивается первое событие в цепочке, которое, как правило, охватное, поскольку знакомит пользователя с продуктом и б) модель суммирует вес шагов одного и того же канала, поскольку обсчитывает вероятность перехода с шага на шаг.

Как вероятностная модель, атрибуция по Маркову может допустить неточности и нуждается в усреднении результатов. Что имеем в итоге? Медийные кампании, которые открывают цепочку и при этом имеют много касаний с пользователями, порой переоцениваются, когда мы имеем дело со сложными многоканальными кампаниями.

Резюмируя, модель Маркова подходит:

  • для старта работы с атрибуцией на основе данных
  • когда реализуются только perfomance каналы
  • когда мало медийных источников или их нет вообще

Но если компания много бюджета тратит на охватные инструменты, то модель с высокой вероятностью будет показывать искаженную картину в пользу медийки.

Модель Шепли

В этом случае можно использовать вектор Шепли. В чем смысл модели? Восприятие цепочки принципиально иное, нежели у Маркова. В первом случае важен каждый шаг, каждый тип события, во втором - уникальное количество каналов, которые участвуют. Для Шепли неважна позиция игрока в цепочке, он рассматривает не процесс розыгрыша, а то, чем игра закончилась и какая из коалиций победила.

Вектор Шепли — это принцип оптимальности распределения выигрыша между игроками в задачах теории кооперативных игр. Происходит усреднение результатов в рамках всех доступных розыгрышей. Есть игроки, определенное количество игр, в которых они участвовали, и разный результат по этим играм. Исходя из всех вводных, рассчитывается суммарный вклад, который дает каждый игрок во всех розыгрышах.

По итогу модель решает, в какой степени конкретное событие цепочки повлияло на результат игры: вспомогательно ли оно воздействовало на него или имело ключевую роль. Тем самым, каждый инструмент оценивается как самостоятельный элемент и моделью определяется, кто являлся основным игроком.

Картинка

Отличительная особенность Вектора Шепли — аксиома болвана. Болваном в теории кооперативных игр называется бесполезный игрок, не вносящий вклада ни в какую коалицию. Система видит реальные результаты инструмента в динамике и в масштабе тысяч цепочек.

Резюмируя, модель Шепли избавлена от переспама по показам и от проблемы переоценки первого контакта. Она не смотрит на конкретные события: показы, клики, переходы — и их позиции в цепочке, а оценивает итог розыгрыша в целом, то есть справедливо атрибутирует вклад каждого элемента.

Найдя фундаментальное применение в большом количестве разных направлений, она используется, например в Google DCM и в ряде продуктов Adobe. Она доказала свою эффективность в том числе и на маркетинговом рынке и имеет для этого качественное математическое обоснование.

Картинка

Атрибуция в маркетинге

Согласно Википедии, маркетинговая атрибуция — это идентификация набора действий пользователя («событий» или «точек взаимодействия») по отношению к цели или конверсии, а затем присвоение значения каждой из этих точек взаимодействия.

Цель маркетинговой атрибуции — получить реальное представление о том, какое событие или какая комбинация на желаемое поведение пользователя в достижении цели.

Бизнесы, которые одновременно проводят контекстные кампании с помощью Яндекс Директа, баннерные — в РСЯ или во Вконтакте, а также запускают мобильную, оффлайн и даже телевизионную рекламу, хотят точно знать, что работает хорошо, а что — плохо, или вовсе не работает.

Логотип

Наш канал про digital-маркетинг, ML и аналитику.

Делимся собственным опытом работы с рекламными данными,
новыми технологиями и собираем лучшие практики оптимизации.

Делимся собственным опытом работы с рекламными данными, новыми технологиями
и собираем лучшие практики оптимизации.

Присоединиться

Чтобы бизнес не терял бюджет, который уходит на конвейерную и бесполезную проверку рекламных гипотез, необходима правильная аналитика. Это значительно упрощает оптимизацию, что позволяет видеть реальную производительность каждого канала в цепочке и, в итоге, делать маркетинг рентабельнее. Модели атрибуции на основе данных как раз позволяют маркетологам оценивать реальные вклады событий в конечную цель кампаний.

McKinsey & Co заявляют, что от 15% до 20% маркетинговых бюджетов ежегодно расходуются впустую и могут быть реинвестированы в другие виды деятельности с большей пользой для бизнеса.

Помимо алгоритмических моделей на рынке существуют и прочие виды, поэтому ниже кратко опишем каждый.

Типы моделей

  • Модель атрибуции по первому клику

    Пользователь увидел пост во Вконтакте и попал на ваш сайт через профиль компании. Он посетил сайт еще 3 раза и конвертировался несколько недель спустя. Все заслуги принадлежат первому касанию — органическому Вконтакте.

  • Модель атрибуции по последнему клику

    Пользователь посещает блог на сайте еженедельно в течение 6 месяцев. Сегодня он увидел объявление во Вконтакте со скидкой на ваш продукт и купил его. Все заслуги принадлежат этой рекламе во Вконтакте.

  • Модель атрибуции по последнему непрямому клику

    Пользователь много раз заходил на ваш сайт из разных источников. Он увидел распродажу зимних комплектов через ретаргетинговую рекламу Яндекс и нажал на нее. Возникли проблемы с оплатой, он ушел с сайта и не совершил покупку, вернулся на следующий день, введя ваш сайт прямо в строку поиска и купил его. Кредиты по-прежнему принадлежат этому ретаргетинговому объявлению Яндекс.

  • Линейная модель атрибуции

    Пользователь впервые попал на ваш сайт через блог. Потом он снова пришел из соцсетей. А потом зашел на сайт из рекламы Яндекс и конвертировался. Каждая точка контакта получает равный вес.

  • Модель атрибуции на основе позиции (U-образная модель атрибуции)

    Первая и последняя точки взаимодействия получают по 40% веса каждая, а остальные точки касания делят оставшиеся 20%.

  • W-образная модель атрибуции

    90% кредита поровну распределяется между тремя точками взаимодействия: первое касание, создание лида и конверсия. Оставшиеся 10% распределяются между другими событиями пути.

  • Модель атрибуции Time Decay

    Пользователь впервые попал на ваш сайт через блог. Потом он снова пришел из соцсетей. А потом зашел на сайт из рекламы Яндекс и конвертировался. Больше всего кредитов получает Яндекс, затем социальные сети, а затем органические (наиболее далекие от конверсии).

  • Модель атрибуции по последнему клику в Google Рекламе

    Пользователь был на вашем сайте 2 раза. Затем пришел снова через объявление Google Ads. После этого несколько раз заходил на сайт из многих источников, кроме Google Ads. Хотя изначально конвертировался по прямому заходу на сайт. Вся ценность присваивается рекламе в Google, то есть событию в середине пути.

  • Модель атрибуции Lead Conversion Touch

    Пользователь нашел ваш блог через органический поиск, подписался и стал лидом. Вы прогрели его, и он купил ваш продукт. Вся ценность присваивается органике, так как лидом он стал оттуда.

  • Полноценная (Z-образная) модель атрибуции:

    90% кредита поровну распределяется между четырьмя основными каналами: первое касание (22,5%), лидогенерация (22,5%), создание возможностей прихода к конверсии (22,5%), закрытие клиента (22,5%). Оставшиеся 10% распределяются между остальными событиями.

  • Пользовательская, алгоритмическая или управляемая данными (data-driven) модель атрибуции

    Самая точная и продвинутая. Она выполняет углубленный анализ пути клиента, чтобы определить все маркетинговые каналы, играющие роль в привлечении посетителей на веб-сайт и конвертация их в клиентов, а также в присвоении событиям той ценности, которую они заслуживают, исходя из правил конкретной модели.

Резюме

Чтобы начать работу с моделями атрибуции на основе данных, необходимо определиться с задачами, которые стоят перед маркетинговым отделом. Если бренд не проводит медийные кампании или проводит, но мало, то стоит попробовать модель Маркова из-за ее доступности и простоты внедрения. Но в случае если кампании преимущественно ориентированы на повышение знания о бренде, то есть бюджет распределяется в пользу охватных инструментов, то лучше обратить внимание на более продвинутую и сложную модель по Шепли.

поделиться:
Популярные статьи
статья 2 min read Модели атрибуции - что это и какая подойдет вашему бизнесу? Рассказываем, как с помощью атрибуции бизнес может избежать лишних расходов и кратко улучшить CPA.
Кристина Устиноваредактор CyberBrain
статья 4 min Узнай, как на самом деле работает атрибуция На этапе, когда сквозная аналитика уже собрана и упорядочена, данные нуждаются в оценке, а бюджет - в оптимизации. В чем смысл составлять отчеты по результатам кампании, если после ничего не менять и не перераспределять рекламный бюджет на основе полученных данных? Чтобы оптимизировать работу кампании, нужно проанализировать уникальный путь, который проходит пользователь до совершения конверсии.
Кристина Устиноваредактор CyberBrain
мифы 2 min read Мифы атрибуции. Причем здесь Post-View модель? Чтобы не быть голословными, обратимся к первоисточнику и определимся, что такое Post-View и с чем его едят.
Кристина Устиноваредактор CyberBrain
аналитическая статья 5 min read Data-driven атрибуция - как понять, кому нужна, а для кого это трата времени и сил Разберемся, кому для этих целей нужны сложные модели атрибуции, а кому достаточно классической модели Last Click.
Никита ЛисицынCEO CyberBrain
digital словарь 5 min Как эффективно работать с метрикой CPC? Рассказываем, на что влияет Cost-Per-Click, когда и где применяется и как можно улучшить результаты по рекламным кампаниям за счет комплексной аналитики.
Кристина Устиноваредактор CyberBrain
статья 3 min read Как метрики ROI, ROMI и ROAS связаны с прибылью Кратко и наглядно рассказываем об отличиях между метриками рентабельности как в маркетинге, так и бизнесе в целом.
Кристина Устиноваредактор CyberBrain
Подписывайтесь на канал Мониторим рынок из первоисточников и делимся краеугольными событиями IT и digital-рынков