Иконка стрелки назад Назад

Почему нельзя оптимизировать одну кампанию по двум и более моделям атрибуции

Почему нельзя оптимизировать одну кампанию по двум и более моделям атрибуции

На рынке появилось ноу-хау — большой верификатор предлагает клиентам сдвоенную модель атрибуции Маркова-Шепли. И вроде бы всё хорошо — целых две data driven модели. Одна голова хорошо, а две — лучше, ведь так?

Почему это не будет нормально работать в реальном мире:

  • подобные системы, взятые с потолка, не просто бесполезны
  • они вообще могут оставить бизнес без денег

С одной стороны, рынок двигается вперёд и начинает работать с атрибуцией — это хорошо. Но у клиентов пока нет такого уровня экспертизы, чтобы дать им веер инструментов для оценки рекламы, а дальше — разбирайтесь сами.По факту ноу-хау выглядит именно так: вот две модели атрибуции, крутитесь как хотите.

Вводная статья: Простое объяснение атрибуции с примерами
Более сложный уровень: Какая атрибуция подойдёт вашему бизнесу

Разные модели атрибуции: когда можно и нельзя совмещать

И в теории, и на практике можно использовать несколько моделей атрибуции для независимой оценки кампаний. Нормальная история, если нужно посмотреть на эффективность каналов с разных сторон.

На практике нельзя использовать результаты разных моделей атрибуции для оптимизации — только в теории. И даже так это будет возможно лишь при соблюдении двух условий:

  • если речь идёт о кампаниях одного типа — или performance, или медийные
  • если вы обладаете бесконечными компетенциями, временем и деньгами

Исключение: когда можно оптимизировать кампанию по нескольким моделям атрибуции

Речь о фреймворке, в котором модели образуют единое пространство интерпретации, не противореча друг другу. У нас это связка из трёх моделей: две линейные задают нижнюю и верхнюю границы (недоучёт и переучёт), а Шепли находится между ними как справедливая оценка. В эту систему можно поместить KPI и сразу понять, укладывается ваша кампания в целевые показатели или нет.

Вывод статьи кратко

Связка двух data driven моделей, Шепли и Маркова, не даёт основы для оптимизации — вы всё время будете сравнивать белое и солёное. Модель Маркова-Шепли с натяжкой могла бы работать в идеальном мире, но в реальности всё упирается в многоканальные медиасплиты и ограниченные ресурсы.

Смесь Маркова с Шепли — почему это не работает

  • Марков (цепи Маркова, Markov Chains) — модель про отключение. Отвечает на вопрос: что будет, если убрать канал из цепочки. Это вероятностная модель, которая работает с уникальными взаимодействиями: 10 раз посчитали — 10 разных результатов получили. Подходит для оптимизации или только медийных, или только performance-каналов.

Статья: Чем марковская модель атрибуции отличается от Шепли — подробное сравнение двух data driven моделей

  • Шепли (Shapley Attribution) — модель про добавление. Отвечает на вопрос: что будет, если канал появится в цепочке. Работает по логике из теории игр: вес делится между всеми участниками в зависимости от реального вклада в результат. Подходит для корректной оценки сразу и медийки, и перформа, потому что учитывает их совместное влияние в пути клиента.

Статья: Как работает атрибуция Шепли

Различия моделей на примере медийной рекламы

У Маркова многократные показы учитываются как отдельные касания: 20 показов = 20 переходов с собственным весом = переспам по показам в рамках смешанного сплита. Шепли рассматривает те же показы как участие одного канала в цепочке взаимодействий. Это два разных, не пересекаемых взгляда на мир.

  • Шепли работает на макроуровне с уникальными каналами.
  • Марков — на микроуровне с уникальными взаимодействиями.

Если их результаты сходятся — это удачное совпадение. Но чем сложнее медиасплит, тем меньше такая вероятность.


Сравнение моделей атрибуции Шепли и Маркова: особенности, преимущества, ограничения

КритерийАтрибуция ШеплиАтрибуция Маркова
На какой вопрос отвечаетЧто будет, если канал появится в цепочке (модель про добавление)Что будет, если убрать канал из цепочки (модель про отключение)
Логика расчётаТеория игр: ценность делится между участниками по вкладу в результатВероятностная модель: эффект оценивается через исключение канала
Что именно считаетсяВклад уникальных каналов в путь клиентаВклад уникальных взаимодействий (касания как события)
Уровень работы моделиМакроуровень: уникальные каналы в цепочкеМикроуровень: уникальные взаимодействия в цепочке
Подходит ли для смешанного медиасплита (медийка + performance)Да: учитывает совместное влияние медийки и перформа в пути клиентаНет: применим к чему-то одному; в смешанном сплите даёт системные расхождения
Как трактует многократные показыКак участие одного канала в цепочке взаимодействийКак отдельные касания: много показов превращаются в много взаимодействий с весом (переспам по показам)
Стабильность результатаТребовательна к качеству данных, но сохраняет интерпретацию через вклад каналов в общий результатВероятностная: 10 раз посчитали — 10 разных результатов получили
Требования к даннымНужны цепочки закончившихся конверсийНужны уникальные взаимодействия (другой датасет)
Оптимизация бюджетаПодходит как основа для оптимизации, когда цель — корректная оценка вклада каналов и их совместного влиянияПодходит для оптимизации только в однородных кампаниях (либо медийные, либо performance)
Когда может возникнуть сбойНет полного пути клиента и алгоритма применения результатаСплит многоканальный, есть медийка + перформ, много показов, неполные данные

Оптимизация рекламы: не пытайтесь усидеть на двух стульях

  • Пока рекламные кампании однородны, можно использовать обе модели и сопоставлять их результаты.
  • Когда у вас многоканальный сплит, между Марковым и Шепли начинаются жёсткие расхождения по CPA. Для стратегии оптимизации в любом случае придётся выбрать что-то одно, но на рынке почти никто не даёт готового ответа, что именно.

Пока это обсуждается в отрыве от денег, всё выглядит более-менее безобидно. Как только мы прокидываем цифры в бюджеты, начинается хаос. Марков и Шепли могут показывать совершенно разные результаты. Не плюс-минус и погрешность, а противоположные.

Представим ситуацию

По модели X канал дал 37 конверсий, а по Y — 43. Ещё куда ни шло. А если одна модель насчитает 0, а другая 50? Как это усреднять? То есть канал либо не конвертит вообще, либо туда надо лить все деньги. Усредняем — и отправляем в канал Шрёдингера половину бюджета. Так, что ли?

На практике ситуация ещё хуже

  • Под видом Маркова берётся не полноценная модель, а матрицы транзитивности — таблицы с вероятностью переходов между каналами. Это главный параметр марковской атрибуции: матрицы отражают структуру путей, но сами по себе не отвечают на вопрос, что будет, если убрать канал.
  • У виновника торжества нет полной картины по клиенту. Только медийка без перформа, и то неполная. Модель строится на данных, которые проходят через их инфраструктуру — всё остальное выпадает из анализа. Любая попытка что-либо считать на такой выборке изначально не имеет смысла.

Марков вообще не может корректно работать с медийной рекламой, когда у вас уже есть перформ, и уж тем более когда медийка при этом неполная.

Склеить Маркова и Шепли — попытка жить в двух вселенных. Вы принимаете решения либо через исключение каналов, либо через распределение вклада. Иначе получается модель без чёткой интерпретации, без управленческого смысла и без ответа на вопрос, что с этим делать дальше.

Почему нельзя просто взять и склеить две модели атрибуции

На практике нельзя использовать результаты разных моделей атрибуции для оптимизации — только в теории. И даже так это будет возможно лишь при соблюдении условий:

  • если речь идёт о кампаниях одного типа — или performance, или медийные
  • если вы обладаете бесконечными компетенциями, временем и деньгами

С первым разобрались: Шепли корректно работает сразу и с медийкой, и с перформом, тогда как марковский подход применим к чему-то одному.

Теперь перейдём к вопросу ресурсов. Именно из-за их отсутствия внедрение такой системы окончательно теряет смысл, когда мы приземляем всё на практику.

1. Отсутствие времени, денег и вычислительных ресурсов. Чтобы получать хоть сколько-то применимые к оптимизации результаты, Шепли и Маркова нужно считать каждый день, причём на разном сырье. У них принципиально разные требования к данным:

  • Шепли работает с цепочками закончившихся конверсий
  • Марков — с уникальными взаимодействиями

Это два совершенно разных датасета, и считать их параллельно и одновременно стоит как золотой мост.

2. Главное — проблема оптимизации. Как применять это усреднённое значение на практике? Если по одной модели канал X показывает 0 конверсий, а по другой 100, 50, да пусть даже 10, как можно полагаться на среднее арифметическое при распределении бюджета? Пан или пропал? Система существует сама по себе, отдельно от бизнеса. Никто не пытается довести её до оптимизации.

Гипотетически это могло бы работать, если бы одна модель использовалась строго для performance, а другая — строго для медийки. В теории есть бесконечные вычислительные ресурсы, время на анализ, сильная команда аналитиков и чёткое понимание, зачем вообще это всё считается. Но реальность показывает другое.

Марков + Шепли = коллапс: кейс из практики

У нас был кейс, когда клиент запросил атрибуцию по Маркову, а когда получил расчёты, то увидел, что результаты радикально расходятся с Шепли. Единственный способ проверить модель — подключить заведомо фродовый канал. И в этот момент Марков начал утверждать, что канал полезен и критически важен для сплита. После этого атрибуцию считали только по Шепли.

Модель Маркова-Шепли противоречит логике так же, как модель Первого-последнего касания. Поэтому для оптимизации можно использовать результаты только одной модели атрибуции. Какой — выбираете вы сами. Но выбрать надо что-то одно.

Парадокс двойной атрибуции: сложно для ИП, бессмысленно для Enterprise

Проблема компетенций

Если уж мы всерьёз собрались работать с моделью Маркова-Шепли, алгоритм оптимизации должен выглядеть так:

  • 1. Использовать две модели атрибуции можно только на этапе оценки — и только в том случае, если вы хорошо понимаете, как работают эти модели и какие у них ограничения.
  • 2. Дальше эти результаты необходимо пропускать через критическое понимание собственного медиасплита — как правило, небольшого и относительно устойчивого.
  • 3. И только после этого можно переходить к оптимизации всего медиасплита целиком, опираясь на одну выбранную модель.

Вопрос в том, много ли у нас на рынке тех, кто вообще способен так работать. И есть ли у них на это время. У клиентов могут быть сотни, а иногда и тысячи кампаний.

По сути верификатор предлагает некоему специалисту каждый раз вручную просматривать весь медиасплит по двум моделям и рисовать между ними какую-то третью картину, чтобы понять, к какому выводу он склоняется для принятия решений. Теоретически это можно отыграть. Практически ни у кого на рынке нет на это ресурсов: специалистов, опыта, времени. Для 90% клиентов такой подход просто недостижим.

Сдвоенная оценка, о которой мы говорим в этой статье, может быть полезна среднему бизнесу с небольшим сплитом, но у него обычно не хватает опыта и экспертизы в атрибуции. А у крупных рекламодателей есть и спецы, и опыт, но при большом сплите с перформансом и медийкой такая модель оказывается для них бесполезной.

Запутались? В отдельных материалах рассказываем о том, как с нуля внедрить data driven атрибуцию в бизнес и как выглядят конкретные этапы внедрения.

Зачем нужна атрибуция — многие не понимают

Кто-то скажет: вы адепты Шепли, у вас нет Маркова, поэтому вы предвзяты.

  • Во-первых, атрибуцию Шепли придумали не мы — за ней стоит нобелевский лауреат, модель существует десятилетиями и применима далеко за пределами маркетинга.
  • Во-вторых, Марков у нас тоже есть. И мы прекрасно знаем, как он работает и где ограничен в возможностях.

Мы выбрали Шепли, потому что клиенты хотят оптимизировать кампании, а не набор рандомных подходов на своё усмотрение. Модель корректно оценивает вклад каждого канала, поскольку учитывает взаимодействие и медийки, и перформа, и благодаря этому даёт максимально объективные данные для оптимизации. На минуточку, этой атрибуцией пользуется Google.

Зачем Google или любая другая компания использует атрибуцию

Многие не понимают: сама по себе атрибуция никому не нужна. Это не продукт, не цель и не ценность, а всего лишь компонент в системе принятия решений. Её единственный смысл — дать ответ на практический вопрос: как эффективнее распределить деньги между каналами, чтобы получить больше результата.

Но в этой истории вам продают нерабочий инструмент и говорят: разбирайтесь сами. Вы стали ближе к оптимизации? Нет.

Если вам предлагают веер из моделей на выбор, такая атрибуция бесполезна. Она всегда должна быть связана с получением рекомендаций для оптимизации, бизнес-результатом и деньгами.

Вспоминаем, что такое атрибуция и как ей пользоваться

На рынке появляется всё больше продвинутых решений, но выбирать продукты для работы надо с умом и осторожностью. Даже когда за ними стоят именитые команды крупных брендов.

Сравнивайте, задавайте вопросы, ищите информацию — давайте вместе поднимать уровень компетенций на рынке и критически оценивать новинки. Интерес к data driven растёт, поэтому подобные витрины будут мелькать всё чаще — красивые снаружи, но совершенно непродуманные внутри.

Не изобретайте колесо.
Не рискуйте бюджетом.

Просто запомните

Модели нельзя пересекать. Можно использовать знания и опыт по двум и более моделям для анализа и принятия решений, но не смешивать сырьё и результаты.

Критичные заблуждения при работе с атрибуцией

Миф 1. Две data driven модели лучше одной — значит, можно оптимизировать по двум сразу

Если модели отвечают на разные вопросы и считают разные датасеты, их результаты превращаются в два несовместимых набора данных. В оптимизации это заканчивается тем, что вы сравниваете белое и солёное и не получаете управленческого решения.

Миф 2. Можно просто усреднить результаты Шепли и Маркова

Если по одной модели канал даёт 0 конверсий, а по другой 50, среднее арифметическое не становится истинной эффективностью канала. Это не компромисс, а канал Шрёдингера, в который вы отправляете бюджет без интерпретации и смысла.

Миф 3. Атрибуция сама по себе повышает эффективность маркетинга

Атрибуция — не цель и не ценность, а компонент системы принятия решений. Если за моделью нет чёткой логики применения к KPI и распределению бюджета, она не приближает бизнес к результату.

Ответы на вопросы

Можно ли использовать Шепли и Маркова одновременно?
Да, но только для независимой оценки и анализа. Для оптимизации бюджета выбирают одну модель, иначе вы сравниваете несопоставимые результаты.

Почему нельзя просто усреднить результаты двух моделей?
Потому что модели могут давать противоположные выводы: одна — 0 конверсий, другая — 50. Среднее арифметическое не превращается в управленческое решение.

Когда теоретически возможно оптимизировать кампанию по двум моделям?
Только если кампании одного типа (либо performance, либо медийные) и у вас есть компетенции, время и деньги, чтобы ежедневно считать, анализировать и вручную интерпретировать расхождения.

Почему Шепли подходит для смешанного медиасплита?
Потому что оценивает вклад каналов в общем пути клиента и учитывает совместное влияние медийки и перформа, а не пытается разрезать их на две несовместимые логики.

Почему Марков плохо переносит смешанный сплит с многократными показами?
Потому что учитывает показы как отдельные касания: много показов превращаются в много «взаимодействий» с весом, что раздувает вклад канала в смешанной цепочке.

Какой главный критерий выбора модели для оптимизации?
Наличие понятной интерпретации и прямого ответа на практический вопрос бизнеса: как перераспределить бюджет между каналами, чтобы получить больше результата.

Остались вопросы?

Вы всегда можете:

Подпишитесь на Telegram-канал — там ещё больше полезного и уникального контента. А ещё мы выкладываем наших котов, поэтому вам точно стоит перейти по ссылке 🐱

Подождите,
отправляем заявку...
Успешно Заявка успешно отправлена.
Мы свяжемся с вами
Ошибка Ошибка отправки.
Попробуйте ещё раз