Картинка статьи
Ольга Карповаредактор CyberBrain

Атрибуция Шепли: что это, когда применять, формула расчёта, плюсы и минусы, альтернативы

В основе платформы CyberBrain лежит Shapley Attribution – модель data driven атрибуции, которая максимально объективно оценивает вклад каждого канала в итоговые конверсии. Но кто такой Шепли? И почему его теория, созданная в середине XX века, до сих пор помогает оптимизировать маркетинг? Разберёмся вместе.

Ллойд Шепли: человек, который изобрёл справедливость

Ллойд Шепли – американский математик и экономист, один из ключевых исследователей в области кооперативной теории игр. В 2012 году был удостоен Нобелевской премии по экономике за вклад в теорию устойчивого распределения и практику моделирования рынка.

Шепли изучал, как участники команды могут справедливо распределять выгоду от совместной деятельности. Его главная разработка – значение Шепли (Shapley value) – показывает, какой вклад внёс каждый игрок в общий результат, если учесть все возможные сочетания игроков.

Как работает атрибуция Шепли

Если вы когда-нибудь делили счёт за ужин с друзьями или обсуждали, кто сколько бонусов получит на работе, вы уже сталкивались с интуитивной формой атрибуции Шепли.

Модель анализирует:

  • Как каждый участник влияет на результат.
  • Как изменяется результат, если этот участник присоединяется к разным командам.

В маркетинге атрибуция Шепли определяет, какой рекламный канал реально приводит клиентов, а какой просто занимает место в цепочке и отнимает ресурсы. Один и тот же человек (или рекламная кампания) может быть лидером в одной связке и бесполезным в другой. Именно поэтому Шепли оценивает вклад не по одиночке, а во всех возможных комбинациях. Так, например, медийная реклама может оказаться не чёрной дырой в бюджете, а важным участником цепочки, который помогает другим каналам закрывать продажи.

В каких случаях модель Шепли наиболее эффективна

Когда у вас масштабные кампании, вам нужна модель, которая честно покажет, кто сколько принёс прибыли. Дело в том, что линейные модели атрибуции (Last touch, First click и др.) не дают всей картины эффективности маркетинга, если вы используете:

  • более трёх площадок (Yandex, VK, TG и т. д.)
  • разные виды рекламы (performance + медийка)
  • разные настройки для рекламы (креативы / таргетинг)

Как модель Шепли оценивает мультиканальную рекламу

1. Формирование коалиций
Анализируются все возможные комбинации каналов (например, канал A отдельно, каналы A+B вместе – и так далее).

2. Оценка вклада каждого канала
Рассчитывается средний прирост результата, который канал добавляет при присоединении к разным комбинациям других источников.

3. Итоговый расчёт
Для каждого канала вычисляется его средний вклад во всех возможных комбинациях – получаем объективную оценку его эффективности.

Преимущества атрибуции Шепли

1. Справедливость
Каналу присваивается ценность только за реальный вклад в достижение цели.

2. Учёт взаимодействий
Модель учитывает влияние каналов друг на друга и позволяет определить эффективные связки.

3. Прозрачность
Логика расчёта понятна и легко объясняется бизнес-команде.

4. Гибкость
Шепли подходит для разных типов конверсий и бизнес-задач.

Формула и алгоритм расчёта атрибуции Шепли простым языком

Атрибуция Шепли для канала X = сумма [(ценность комбинации с каналом X – ценность комбинации без канала X) × вероятность появления комбинации каналов без X]

Ещё проще

Для каждой комбинации каналов сравнивается результат с каналом X и без него. Разница между этими результатами умножается на вероятность появления данной комбинации. Все полученные значения суммируются, чтобы получить средний вклад канала X.

Какие данные нужны для расчёта атрибуции Шепли

Чтобы модель показывала честное распределение, важно собрать полный набор данных:

  1. История пути пользователя

    • идентификаторы (ClientID / UserID / Stable ID), чтобы склеивать действия одного человека между сайтом и приложением, а также между разными устройствами

    • последовательность касаний с точным временем: показы рекламы (если учитываются просмотры), клики, визиты на сайт или в приложение

    • информация о канале / источнике / площадке, кампании / группе / объявлении, устройстве, регионе

  2. События конверсии и их ценность

    • все действия, которые считаются целевыми: покупка, заявка, регистрация, пополнение баланса и т. д.

    • время конверсии

    • ценность конверсии: выручка, маржа, количество товаров или чек

    • статус (онлайн / офлайн), если часть конверсий закрывается в CRM или в точках продаж

    • правила учёта: окно атрибуции (например, 7 / 14 / 30 дней), учёт повторных покупок, работа с пост-клик и пост-вью

  3. Данные о расходах и охвате

    • затраты на рекламу по каналам, кампаниям и датам

    • количество показов и охват аудитории, если нужно учитывать эффект от медийной рекламы

  4. Качество данных и фильтрация

    • очистка бот-трафика

    • корректная дедупликация конверсий, если один и тот же пользователь мог оставить несколько заявок или касание засчиталось дважды

    • единые правила работы с UTM-метками и источниками, чтобы каналы не смешивались

  5. Идентификация и склейка офлайн-данных

    • механизмы для объединения онлайн и офлайн информации: например, связка по телефону, e-mail или ID клиента в CRM

    • правила объединения действий одного пользователя в разных каналах (например, человек посмотрел рекламу на смартфоне, а покупку совершил с ноутбука)

  6. Вспомогательные данные для проверки и уточнения модели

    • результаты специальных экспериментов (например, сравнение групп с рекламой и без неё), чтобы проверить, какой прирост реально даёт канал

    • внешние факторы, которые могут влиять на продажи: сезонность, акции конкурентов, цены, наличие товара

Для базового расчёта атрибуции Шепли достаточно истории пути пользователя и событий конверсии — этого хватает, чтобы распределить вклад между каналами. Остальные данные — расходы, показы, офлайн-продажи, правила окон атрибуции, результаты экспериментов и внешние факторы — не обязательны для самого расчёта, но критически важны для точности и управленческой пользы: они позволяют учитывать медийку, корректно считать ROI / ROMI, не терять ценность офлайн-продаж и отделять корреляцию от реального прироста.

Ограничения атрибуции Шепли

1. Не доказывает причинность сама по себе
Атрибуция Шепли показывает, как каналы связаны с конверсиями по факту, но не отвечает на вопрос: «А были бы эти конверсии без рекламы?». То есть модель распределяет вклад на основе корреляций в данных, а не на основе прямого доказательства, что именно канал вызвал покупку. Чтобы убедиться в реальном приросте (инкременте), нужны эксперименты или специальные поправки в исходных данных.

2. Чувствительность к правилам и определению ценности
Что и как мы считаем: пост-клик / пост-вью, окна атрибуции, дедупликация, учёт органики — всё это напрямую влияет на итоговое распределение. Неверные правила = неверные доли.

3. Вычислительная нагрузка и требования к данным
Чем больше у вас каналов и касаний, тем сложнее применять модель Шепли: комбинаций становится слишком много, и пересчёт может занять часы или даже дни. Поэтому на практике используют приближённые методы, которые дают тот же результат, но быстрее. Плюс модель требует полных данных о пути пользователя — если часть касаний теряется (например, не учитываются показы или переходы между устройствами), распределение получится искажённым.

4. Ограничения трекинга и доступности данных
Не все пользовательские данные доступны для анализа: часть площадок закрыта, идентификаторы теряются, правила приватности ограничивают отслеживание. В результате путь клиента фиксируется не полностью, и модель Шепли может распределять вклад каналов с искажением. Чтобы компенсировать эти пробелы, компании комбинируют Шепли с агрегированными моделями (например, MMM), которые работают на укрупнённых данных и устойчивее к потерям.

Какие есть альтернативы атрибуции Шепли

1. Марковская модель (Markov Chains / Removal Effect)

Что это. Модель рассматривает путь клиента как последовательность переходов между каналами. Вклад канала измеряется через то, насколько падает вероятность конверсии, если убрать этот канал из всех цепочек.

  • Markov Chains — это общий подход, где путь пользователя моделируется как цепочка переходов между состояниями (каналами).

  • Removal Effect — это конкретный способ вычисления вклада канала в рамках марковской атрибуции: мы убираем канал из цепочки и смотрим, как изменилась вероятность дойти до конверсии.

Как работает.

  • строится граф переходов между каналами,

  • считается вероятность дойти до конверсии,

  • затем канал «удаляется», и вероятность пересчитывается,

  • разница показывает вклад канала.

Где уместно. Подходит, если у компании есть данные о последовательностях касаний и нужно понять, без каких звеньев цепочка «ломается».

Ограничения. Требует полной информации о путях, плохо работает с очень короткими цепочками, остаётся корреляционным методом.

Отличие от Шепли. Марковская модель оценивает вклад через вероятность прохождения пути, а Шепли — через анализ всех возможных комбинаций каналов. Шепли учитывает все сценарии взаимодействий, а Марков делает акцент на структуре переходов.

2. Регрессионные модели атрибуции

Что это. Статистические модели, которые предсказывают вероятность конверсии на основе того, какие касания были у пользователя. Вес канала определяется его влиянием в модели.

Как работает. Формируются признаки (наличие касания, количество, давность), строится модель и оценивается вклад каждого канала через коэффициенты.

Где уместно. Подходит для компаний, которые хотят быстрый прогноз и стабильные веса без сложных переборов.

Ограничения. Учитывает только то, что мы правильно заложили в модель. Порядок и взаимодействия каналов отражаются хуже, чем в Шепли.

Отличие от Шепли. Регрессии работают напрямую с признаками и коэффициентами, тогда как Шепли рассчитывает средний вклад канала во всех комбинациях. Шепли даёт более «игровую» интерпретацию, а регрессия — более «техническую».

3. Эксперименты на прирост (Incrementality / Lift)

Что это. Рандомизированные тесты, где одна группа людей видит рекламу, а другая — нет. Разница в конверсиях показывает реальный прирост за счёт рекламы.

Как работает. Аудитория делится на группы, запускается эксперимент, после чего сравниваются результаты.

Где уместно. Когда нужно доказать, что канал или кампания реально влияет на продажи, а не просто «сопровождает» клиентов.

Ограничения. Дорого и долго: нужен бюджет на тест, время и достаточно большая аудитория.

Отличие от Шепли. Эксперименты показывают причинность, а Шепли — только распределяет вклад на основе фактических данных. Оптимально использовать их вместе: эксперименты калибруют функцию ценности для Шепли.

4. MMM (Marketing Mix Modeling)

Что это. Эконометрический подход, который анализирует агрегированные данные — например, продажи и рекламные расходы по дням или неделям. Модель учитывает сезонность, акции, цены и оценивает вклад каналов на высоком уровне.

Как работает. Строится статистическая модель, где продажи зависят от расходов на рекламу и внешних факторов. Результат показывает, сколько продаж приносит каждый канал при разном уровне инвестиций.

Где уместно. Когда нет детальных пользовательских данных или нужны стратегические решения по распределению больших бюджетов.

Ограничения. Данные должны быть качественными и достаточно длинными по времени. Метод не подходит для оценки конкретных связок или креативов.

Отличие от Шепли. MMM работает на агрегированных данных (по времени и суммам), а Шепли — на пользовательских цепочках. Шепли отвечает на вопрос «как распределить вклад внутри пути», а MMM — «какой вклад канал вносит на уровне бизнеса в целом».

5. Гибридные модели

Что это. Подходы, которые совмещают несколько методов. Например, можно использовать эксперименты для проверки прироста и на их основе корректировать модель Шепли или регрессию.

Как работает. Сначала тесты дают «эталонные» данные о приросте, затем эти данные применяются внутри другой модели, чтобы распределение стало ближе к реальности.

Где уместно. Когда нужно соединить масштабируемость атрибуции с доказательностью экспериментов.

Ограничения. Требует дополнительных ресурсов и хорошей координации между командами.

Отличие от Шепли. Гибриды не заменяют Шепли, а усиливают его. Они дают возможность встроить в расчёты каузальные поправки и сгладить слабые места классической атрибуции.

FAQ: частые вопросы

Можно ли внедрить Шепли в малом бизнесе?
Не ждите окупаемости, если у вас 200–300 конверсий в месяц. Для малого бизнеса лучше подойдут простые модели (Last Click, линейная).

Шепли всегда точнее?
Точнее, но при условии качественного трекинга и достаточного объёма данных.

Можно ли использовать Шепли вместе с инкрементальностью?
Да. Шепли показывает вклад каналов внутри цепочки, инкрементальность — даёт ответ, создаёт ли канал прирост вообще.

Выводы

Модель Шепли – не просто теоретическая концепция. Это базовая логика платформы CyberBrain, которая помогает клиентам:

  • Видеть, какие кампании на самом деле приносят выручку.
  • Сокращать неэффективные каналы.
  • Перераспределять бюджет туда, где он работает лучше всего.

🚀 Подключайтесь к CyberBrain – и труды нобелевского лауреата будут работать на прибыльность вашего бизнеса.

поделиться:
Популярные статьи
статья 10 min read Как и зачем внедрять data-driven атрибуцию в бизнес: 5 основных шагов Атрибуция на основе данных — мощное решение для контроля эффективности и оптимизации рекламы. Но как его интегрировать и можно ли это сделать самостоятельно? В этой статье мы вместе преодолеем пять основных препятствий на пути к внедрению атрибуции — и превратим их в пять конкретных шагов для реализации.
Ольга Карповаредактор CyberBrain
оптимизация 12 min read Больше лидов — меньше CPA: первый и единственный гайд по оптимизации медийной рекламы от CyberBrain Медийная реклама должна работать на продажи — и точка. В статье вас ждёт описание фреймворка, который служит именно этой цели.
Никита Лисицын CEO CyberBrain
проблемы и решения 3 min read Анализ расхождений трекера и кабинетов Системный подход к оптимизации медийной рекламы невозможен без чистых данных. Но что если данные трекера и рекламного кабинета не совпадают? Рассказываем, откуда берутся расхождения и что с этим делать.
Никита Лисицын CEO CyberBrain
сравнение 14 min Как атрибуция дополняет моделирование маркетингового микса Атрибуция и маркетинговый микс: как совместить анализ пути клиента и моделирование каналов, чтобы правильно распределять бюджеты и повышать продажи.
Ольга Карповаредактор CyberBrain
статья 9 min Как перестроить атрибуцию под новые правила конфиденциальности Серверный сбор событий, согласия, локальное хранение данных и показатели качества — практическое руководство по соответствию атрибуции требованиям 152-ФЗ.
Ольга Карповаредактор CyberBrain
обзор 14 min Дашборды и BI-системы: обзор популярных решений Что выбрать для маркетинговой аналитики и управления digital-кампаниями? Разбираем сильные и слабые стороны популярных инструментов, тарифы и ограничения, сценарии применения — от малого бизнеса до корпоративной аналитики больших данных. В конце статьи — краткое резюме, которое поможет определиться с выбором.
Ольга Карповаредактор CyberBrain
Подписывайтесь на канал Мониторим рынок из первоисточников и делимся краеугольными событиями IT и digital-рынков