Для базового расчёта атрибуции Шепли достаточно истории пути пользователя и событий конверсии — этого хватает, чтобы распределить вклад между каналами. Остальные данные — расходы, показы, офлайн-продажи, правила окон атрибуции, результаты экспериментов и внешние факторы — не обязательны для самого расчёта, но критически важны для точности и управленческой пользы: они позволяют учитывать медийку, корректно считать ROI / ROMI, не терять ценность офлайн-продаж и отделять корреляцию от реального прироста.
Ограничения атрибуции Шепли
1. Не доказывает причинность сама по себе
Атрибуция Шепли показывает, как каналы связаны с конверсиями по факту, но не отвечает на вопрос: «А были бы эти конверсии без рекламы?». То есть модель распределяет вклад на основе корреляций в данных, а не на основе прямого доказательства, что именно канал вызвал покупку. Чтобы убедиться в реальном приросте (инкременте), нужны эксперименты или специальные поправки в исходных данных.
2. Чувствительность к правилам и определению ценности
Что и как мы считаем: пост-клик / пост-вью, окна атрибуции, дедупликация, учёт органики — всё это напрямую влияет на итоговое распределение. Неверные правила = неверные доли.
3. Вычислительная нагрузка и требования к данным
Чем больше у вас каналов и касаний, тем сложнее применять модель Шепли: комбинаций становится слишком много, и пересчёт может занять часы или даже дни. Поэтому на практике используют приближённые методы, которые дают тот же результат, но быстрее. Плюс модель требует полных данных о пути пользователя — если часть касаний теряется (например, не учитываются показы или переходы между устройствами), распределение получится искажённым.
4. Ограничения трекинга и доступности данных
Не все пользовательские данные доступны для анализа: часть площадок закрыта, идентификаторы теряются, правила приватности ограничивают отслеживание. В результате путь клиента фиксируется не полностью, и модель Шепли может распределять вклад каналов с искажением. Чтобы компенсировать эти пробелы, компании комбинируют Шепли с агрегированными моделями (например, MMM), которые работают на укрупнённых данных и устойчивее к потерям.
Какие есть альтернативы атрибуции Шепли
1. Марковская модель (Markov Chains / Removal Effect)
Что это. Модель рассматривает путь клиента как последовательность переходов между каналами. Вклад канала измеряется через то, насколько падает вероятность конверсии, если убрать этот канал из всех цепочек.
-
Markov Chains — это общий подход, где путь пользователя моделируется как цепочка переходов между состояниями (каналами).
-
Removal Effect — это конкретный способ вычисления вклада канала в рамках марковской атрибуции: мы убираем канал из цепочки и смотрим, как изменилась вероятность дойти до конверсии.
Как работает.
-
строится граф переходов между каналами,
-
считается вероятность дойти до конверсии,
-
затем канал «удаляется», и вероятность пересчитывается,
-
разница показывает вклад канала.
Где уместно. Подходит, если у компании есть данные о последовательностях касаний и нужно понять, без каких звеньев цепочка «ломается».
Ограничения. Требует полной информации о путях, плохо работает с очень короткими цепочками, остаётся корреляционным методом.
Отличие от Шепли. Марковская модель оценивает вклад через вероятность прохождения пути, а Шепли — через анализ всех возможных комбинаций каналов. Шепли учитывает все сценарии взаимодействий, а Марков делает акцент на структуре переходов.
2. Регрессионные модели атрибуции
Что это. Статистические модели, которые предсказывают вероятность конверсии на основе того, какие касания были у пользователя. Вес канала определяется его влиянием в модели.
Как работает. Формируются признаки (наличие касания, количество, давность), строится модель и оценивается вклад каждого канала через коэффициенты.
Где уместно. Подходит для компаний, которые хотят быстрый прогноз и стабильные веса без сложных переборов.
Ограничения. Учитывает только то, что мы правильно заложили в модель. Порядок и взаимодействия каналов отражаются хуже, чем в Шепли.
Отличие от Шепли. Регрессии работают напрямую с признаками и коэффициентами, тогда как Шепли рассчитывает средний вклад канала во всех комбинациях. Шепли даёт более «игровую» интерпретацию, а регрессия — более «техническую».
3. Эксперименты на прирост (Incrementality / Lift)
Что это. Рандомизированные тесты, где одна группа людей видит рекламу, а другая — нет. Разница в конверсиях показывает реальный прирост за счёт рекламы.
Как работает. Аудитория делится на группы, запускается эксперимент, после чего сравниваются результаты.
Где уместно. Когда нужно доказать, что канал или кампания реально влияет на продажи, а не просто «сопровождает» клиентов.
Ограничения. Дорого и долго: нужен бюджет на тест, время и достаточно большая аудитория.
Отличие от Шепли. Эксперименты показывают причинность, а Шепли — только распределяет вклад на основе фактических данных. Оптимально использовать их вместе: эксперименты калибруют функцию ценности для Шепли.
4. MMM (Marketing Mix Modeling)
Что это. Эконометрический подход, который анализирует агрегированные данные — например, продажи и рекламные расходы по дням или неделям. Модель учитывает сезонность, акции, цены и оценивает вклад каналов на высоком уровне.
Как работает. Строится статистическая модель, где продажи зависят от расходов на рекламу и внешних факторов. Результат показывает, сколько продаж приносит каждый канал при разном уровне инвестиций.
Где уместно. Когда нет детальных пользовательских данных или нужны стратегические решения по распределению больших бюджетов.
Ограничения. Данные должны быть качественными и достаточно длинными по времени. Метод не подходит для оценки конкретных связок или креативов.
Отличие от Шепли. MMM работает на агрегированных данных (по времени и суммам), а Шепли — на пользовательских цепочках. Шепли отвечает на вопрос «как распределить вклад внутри пути», а MMM — «какой вклад канал вносит на уровне бизнеса в целом».
5. Гибридные модели
Что это. Подходы, которые совмещают несколько методов. Например, можно использовать эксперименты для проверки прироста и на их основе корректировать модель Шепли или регрессию.
Как работает. Сначала тесты дают «эталонные» данные о приросте, затем эти данные применяются внутри другой модели, чтобы распределение стало ближе к реальности.
Где уместно. Когда нужно соединить масштабируемость атрибуции с доказательностью экспериментов.
Ограничения. Требует дополнительных ресурсов и хорошей координации между командами.
Отличие от Шепли. Гибриды не заменяют Шепли, а усиливают его. Они дают возможность встроить в расчёты каузальные поправки и сгладить слабые места классической атрибуции.
FAQ: частые вопросы
Можно ли внедрить Шепли в малом бизнесе?
Не ждите окупаемости, если у вас 200–300 конверсий в месяц. Для малого бизнеса лучше подойдут простые модели (Last Click, линейная).
Шепли всегда точнее?
Точнее, но при условии качественного трекинга и достаточного объёма данных.
Можно ли использовать Шепли вместе с инкрементальностью?
Да. Шепли показывает вклад каналов внутри цепочки, инкрементальность — даёт ответ, создаёт ли канал прирост вообще.