Ольга Карпова , редактор CyberBrain

Как проверять данные в атрибуции и не делать ложных выводов об эффективности каналов

Если атрибуция работает на неполных, дублирующихся или плохо склеенных данных, выводы модели будут неверными. Технически ошибки нет: система просто считает по той базе, которая в неё попала, но вряд ли вам захочется принимать решения по бюджету на основе ложных выводов.

Если хотите пройти тему атрибуции по порядку, начните с большой обзорной статьи. После неё уже удобно переходить к этой статье про проверку данных.

Эта статья посвящена практической проверке качества данных в атрибуции. Перед обсуждением долей каналов, перераспределением бюджета и сравнением моделей полезно сначала ответить на базовый вопрос: можно ли доверять данным, на которых построен отчёт.

Почему атрибуцию нельзя интерпретировать автоматически

Атрибуция считает только те данные, которые попали в систему. Если в данных есть разрывы, ошибки склейки, расхождения между системами или слишком короткое окно атрибуции, итоговый отчёт будет выглядеть аккуратно, но выводы по нему могут оказаться неточными.

Именно поэтому проверка данных нужна до интерпретации результатов. Она помогает понять, что именно показывает отчёт, насколько полным получился путь пользователя и есть ли у команды достаточная база для принятия решений.

В практической работе обычно важно разделить две ситуации:

различие связано с логикой модели, и это нормальное поведение расчёта;
различие связано с качеством данных, и тогда сначала нужно разбираться с источниками, склейкой и правилами учёта.

Какие проблемы данных чаще всего искажают атрибуцию

Разорванный путь пользователя

Если система не связывает касания одного и того же человека между устройствами, браузерами, визитами или этапами воронки, путь распадается на части. Тогда ранние взаимодействия выпадают из анализа, а поздние получают больший вес.

На практике это выглядит так: пользователь впервые увидел рекламу с телефона, позже вернулся с ноутбука, а заявку оставил после прямого визита. Если идентификаторы не склеены, отчёт увидит только финальный фрагмент пути и присвоит лишний вклад прямому визиту или брендовому поиску.

Дубли конверсий

Если одно и то же целевое действие отправляется в систему несколько раз, атрибуция начинает распределять ценность по завышенному количеству результатов. Особенно чувствительны к этому заявки, заказы, лиды и выгрузки из CRM (системы управления клиентскими данными), где одно событие иногда попадает в отчёт дважды.

В такой ситуации цифры выглядят выше, чем должны быть по факту, и каналы получают лишний вклад.

Слишком много прямых и неопределённых источников

Если в атрибуции быстро растёт доля прямых визитов (Direct), неопределённых источников (Unknown) или служебных категорий вроде None / Other (без определения / прочее), это обычно говорит о потере части источников по дороге. Причина может быть в разметке, редиректах, передаче параметров, канальной классификации или логике импорта данных.

Прямой визит сам по себе не считается ошибкой. Рост таких источников требует отдельной проверки до любых выводов по эффективности каналов.

Разные правила учёта в разных системах

Одна из самых частых проблем связана с тем, что отчёты собираются по разной логике. Рекламная платформа может считать учёт по клику (post-click), аналитика сайта — модель последнего непрямого перехода, CRM — только подтверждённые продажи, а внутри BI (системы бизнес-отчётности) лежит ещё одна версия конверсии после очистки дублей.

Цифры в этих системах могут относиться к разным сущностям. Сначала полезно убедиться, что команда сравнивает сопоставимые показатели.

Слишком короткое окно атрибуции

Даже при хорошем трекинге картина искажается, если окно выбрано так, что заметная часть пути не попадает в расчёт. Это особенно чувствительно в длинных циклах сделки, в B2B, в дорогих покупках и в воронках с медийными размещениями.

Если тема окна атрибуции ещё не разобрана подробно, откройте статью «Окно атрибуции: что это такое и как его правильно оценивать». Здесь важен один практический вывод: короткое окно может обрезать путь пользователя и изменить распределение вклада между каналами.

Неучтённый лаг данных

Часть конверсий созревает с задержкой. Пользователь может вернуться через несколько дней, CRM может подтянуть статус позже, а часть расчётов может обновляться не в тот же день. Если смотреть отчёт слишком рано, аналитика работает с промежуточным состоянием данных.

Из-за этого часто занижается вклад каналов верхней части воронки и появляются слишком ранние выводы по свежим кампаниям.

Чек-лист проверки данных перед тем, как смотреть доли каналов

Ниже — базовый рабочий чек-лист. Он помогает быстро ответить на вопрос: можно ли интерпретировать текущий отчёт по атрибуции.

1. Проверьте, совпадает ли число конверсий с базовой системой учёта

Сначала полезно понять, стабилен ли сам фундамент отчёта. Сопоставьте число заявок, заказов или лидов в атрибуции с тем местом, которое у вас считается базовым источником правды: CRM, аналитикой сайта, внутренней базой или системой продаж.

Полного совпадения может не быть. Важнее, чтобы расхождение было понятным и объяснимым.

2. Посмотрите, не растёт ли доля прямых и неопределённых источников

Это быстрый индикатор потери источников. Если доля прямых визитов или неопределённых категорий растёт без понятной причины, стоит проверить разметку, редиректы, передачу параметров, склейку и канальную классификацию.

3. Проверьте, не дублируются ли события

Если одна и та же заявка или продажа может попасть в отчёт несколько раз, атрибуция становится недостоверной. На практике полезно проверить уникальность идентификаторов события, заказов, лидов и логику импорта из CRM.

4. Сравните отчёт при разной длине окна

Если при небольшом изменении окна картина каналов резко меняется, это требует объяснения. Иногда это говорит о длинном пути до конверсии. Иногда сигнализирует о проблеме с лагом данных или потерей ранних касаний.

5. Посмотрите на реальные пути, а не только на агрегаты

Сводная таблица может скрывать странные цепочки. Полезно открыть примеры путей и проверить, насколько они выглядят естественно: нет ли слишком большого числа одинаковых повторов, внезапного доминирования прямых визитов, пустых промежутков или слишком коротких цепочек там, где путь обычно длиннее.

Запись на демо продукта

CEO CyberBrain расскажет о платформе и предложит лучшее решение ваших задач

Записаться на демо

6. Убедитесь, что правила учёта одинаковы между системами

Перед сравнением полезно зафиксировать:

какая именно конверсия считается;
по какому окну считается вклад;
учитывается ли учёт по показу без клика (post-view);
как обрабатываются прямые визиты;
есть ли очистка дублей;
что считается подтверждённым результатом, а что сырым лидом.

7. Учтите лаг данных

Свежая дата требует особой осторожности. Если воронка длинная, данные по последним дням или неделям могут быть ещё незрелыми. В такой ситуации окончательные выводы делают только после того, как у периода накопился достаточный горизонт наблюдения.

8. Проверьте, понимаете ли вы, что именно считается конверсией

Здесь часто возникает путаница. В одном отчёте может считаться отправка формы, в другом — квалифицированный лид, в третьем — продажа, в четвёртом — импортированная выручка. Для интерпретации атрибуции важно, чтобы команда одинаково понимала объект расчёта.

Как понять, что проблема связана с данными

Команды часто начинают спорить о модели, когда корень вопроса находится раньше — на уровне качества данных. Разница между моделями сама по себе считается нормальной: у них разная логика распределения вклада.

На проблемы в данных обычно указывают другие признаки.

Признак 1. Слишком много технических источников

Если в отчёте растут Direct, Unknown, None, Other и похожие категории, сначала полезно проверить качество источников и передачу данных.

Признак 2. Картина резко меняется при небольшом изменении правил

Если вы немного меняете окно или период, а доли ключевых каналов сильно перестраиваются без понятной бизнес-логики, стоит посмотреть на полноту пути и зрелость данных.

Признак 3. Пути выглядят неестественно

Например, верхняя часть воронки почти исчезает, а весь вклад стабильно уходит в финальные визиты. Такое поведение требует проверки сбора ранних касаний и логики склейки.

Признак 4. Отчёт по атрибуции расходится с операционной реальностью

Если команда точно знает, что медийные размещения работают на вход в воронку, а отчёт стабильно показывает почти нулевой вклад, стоит проверить окно, лаг, учёт по показу без клика (post-view) и склейку пути пользователя.

Признак 5. Расхождения между системами никто не может объяснить

Разница между аналитикой сайта, BI, CRM и рекламными кабинетами допустима, если команда понимает, откуда она берётся. Для принятия решений важно, чтобы методология за каждой цифрой была описана словами.

Если команда уже сравнивает именно модели атрибуции на основе данных (data driven), можно отдельно прочитать статью «Модели атрибуции Шепли и Маркова: чем отличаются и когда какую использовать».

Когда по атрибуции можно принимать бюджетные решения

Атрибуция становится полезной для действий в тот момент, когда у команды есть достаточная уверенность в данных и понятная логика расчёта. Полная идеальность встречается редко. Рабочая надёжность для решений встречается гораздо чаще.

По атрибуции можно принимать решения, связанные с бюджетом, если:

понятно, какая конверсия лежит в основе расчёта;
расхождения между системами объяснимы;
нет явной проблемы с дублями событий;
доля прямых и неопределённых источников не выглядит аномальной;
окно атрибуции и лаг данных учтены;
смена модели не превращает картину в хаотичную;
пути пользователя в целом выглядят правдоподобно.

Даже хороший отчёт полезно читать вместе с операционным контекстом: экономикой канала, зрелостью кампании, ограничениями инвентаря, сезонностью и целями бизнеса.

Главный практический принцип здесь простой: сначала проверить, что отчёт можно уверенно читать, потом переходить к выводам и действиям.

Частые вопросы по атрибуции

Что проверять первым делом, если атрибуция показывает странные цифры

В первую очередь полезно проверить базовое число конверсий, долю прямых и неопределённых источников, наличие дублей и зрелость данных по периоду.

Нормально ли, что разные модели атрибуции дают разный результат

Да, это нормальная ситуация. Разные модели распределяют вклад по разной логике.

Можно ли доверять отчёту, если данные между системами немного расходятся

Да, если расхождение ожидаемо и понятно по методологии. Для работы важна объяснимость разницы.

Когда источник вопроса чаще всего находится в данных

Обычно это видно по росту технических источников, потере ранних касаний, плавающему числу конверсий, нестабильным путям и сильной зависимости отчёта от небольших изменений правил учёта.

Нужно ли сначала настраивать идеальную атрибуцию

Для практической работы достаточно надёжной системы, которой можно доверять на уровне принятия решений. Основа этой надёжности — проверка данных и понятные правила расчёта.

Вывод

Главная ошибка в работе с атрибуцией связана с тем, что обсуждение каналов начинается раньше проверки самого расчёта. В такой последовательности команда быстро получает ложные выводы и спорит уже о последствиях, а не о причине.

Если данные не склеены, события дублируются, прямые визиты разрастаются, окно атрибуции обрезает путь, а лаг данных не учтён, интерпретация каналов становится ненадёжной. Сильная работа с атрибуцией начинается с проверки основы: что именно считает система и насколько эта база пригодна для решений.

Запись на демо продукта

CEO CyberBrain расскажет о платформе и предложит лучшее решение ваших задач

Записаться на демо

Почему атрибуцию нельзя интерпретировать автоматически

Какие проблемы данных чаще всего искажают атрибуцию

Разорванный путь пользователя

Дубли конверсий

Слишком много прямых и неопределённых источников

Разные правила учёта в разных системах

Слишком короткое окно атрибуции

Неучтённый лаг данных

Чек-лист проверки данных перед тем, как смотреть доли каналов

1. Проверьте, совпадает ли число конверсий с базовой системой учёта

2. Посмотрите, не растёт ли доля прямых и неопределённых источников

3. Проверьте, не дублируются ли события

4. Сравните отчёт при разной длине окна

5. Посмотрите на реальные пути, а не только на агрегаты

Запись на демо продукта

6. Убедитесь, что правила учёта одинаковы между системами

7. Учтите лаг данных

8. Проверьте, понимаете ли вы, что именно считается конверсией

Как понять, что проблема связана с данными

Признак 1. Слишком много технических источников

Признак 2. Картина резко меняется при небольшом изменении правил

Признак 3. Пути выглядят неестественно

Признак 4. Отчёт по атрибуции расходится с операционной реальностью

Признак 5. Расхождения между системами никто не может объяснить

Когда по атрибуции можно принимать бюджетные решения

Частые вопросы по атрибуции

Что проверять первым делом, если атрибуция показывает странные цифры

Нормально ли, что разные модели атрибуции дают разный результат

Можно ли доверять отчёту, если данные между системами немного расходятся

Когда источник вопроса чаще всего находится в данных

Нужно ли сначала настраивать идеальную атрибуцию

Вывод

Запись на демо продукта

Отправить заявку