Как объединить дублирующиеся контакты в Trigly
Пошаговая инструкция: поиск дубликатов, автоматическое и ручное объединение, правила слияния данных.
Дублирование контактов — одна из самых распространенных проблем клиентских баз. По нашей статистике, в средней базе e-commerce из 50 000 записей содержится 8-15% дубликатов. Один клиент может быть записан несколько раз: при регистрации указал email, при заказе — телефон, при обращении в поддержку — другой email. Результат: искаженная аналитика, двойные рассылки и раздраженные клиенты.
В Trigly встроен инструмент для поиска и объединения дубликатов, который решает проблему как в ручном, так и в автоматическом режиме.
Почему дубликаты опасны
Дублирование контактов приводит к целому каскаду проблем:
- Искаженные метрики: RFM-скоринг занижается, потому что покупки одного клиента распределены по нескольким профилям. AI-скоринг и качество данных также страдают.
- Двойные рассылки: клиент получает одно и то же письмо дважды на разные адреса. Это прямой путь к отпискам и жалобам на спам.
- Неточная сегментация: динамические сегменты могут включать оба профиля или, наоборот, не включить ни один (если данные разделены).
- Потеря контекста: менеджер не видит полную историю клиента, потому что часть взаимодействий записана в другой профиль.
- Завышенный размер базы: вы платите за контакты, которые на самом деле являются одним человеком.
Как Trigly находит дубликаты
Перейдите в CDP, затем в Контакты и нажмите "Дубликаты". Trigly использует несколько стратегий поиска:
Точное совпадение
- Email: два профиля с одинаковым email (с учетом нормализации: пробелы, регистр)
- Телефон: совпадение после нормализации формата (+7 / 8 / без кода)
Нечеткое совпадение
- Имя + Фамилия + Город: комбинация полей first_name, last_name и city. Учитывает распространенные вариации (Иван/Ivan, Москва/москва).
Вероятностное совпадение
- Комбинация нескольких частичных совпадений: одинаковое имя + похожий email-домен + один город.
Результат поиска — список групп потенциальных дубликатов с указанием процента вероятности совпадения. Вы видите оба профиля рядом и можете принять решение.
Совет: Запускайте поиск дубликатов после каждого массового импорта контактов. Это поможет сразу выявить пересечения с существующей базой.
Ручное объединение: пошагово
Для точечной работы с дубликатами:
Шаг 1: Выберите основной профиль (master)
Основной профиль — тот, который останется после слияния. Рекомендации по выбору:
- Профиль с более полными данными (больше заполненных полей)
- Профиль с более давней историей (раньше создан)
- Профиль с подтвержденным email
Шаг 2: Отметьте дубликаты
Выберите один или несколько профилей для объединения с master-профилем.
Шаг 3: Проверьте правила слияния
Trigly автоматически применяет следующие правила при объединении:
| Тип данных | Правило |
|---|---|
| Теги | Union (объединение всех тегов из обоих профилей) |
| total_revenue | Сумма значений из обоих профилей |
| total_orders | Сумма значений из обоих профилей |
| last_activity_at | Берется более позднее значение |
| first_name, last_name | Берутся из master-профиля (если заполнены) |
| email, phone | Берутся из master-профиля; дополнительные сохраняются как альтернативные идентификаторы |
| События (ClickHouse) | Все события переносятся на master-профиль |
| Сообщения кампаний | История переносится на master-профиль |
| Членство в сегментах | Объединяется из обоих профилей |
| custom_fields | Deep merge (поля из дубликата добавляются, если отсутствуют в master) |
Шаг 4: Подтвердите объединение
После подтверждения дубликат удаляется, а все данные переносятся. Действие необратимо — Trigly записывает операцию в журнал аудита (ContactChange) для отслеживания.
Частые ошибки при ручном объединении:
- Выбор неправильного master-профиля — если объединили не тот, восстановить данные можно только из резервной копии.
- Объединение непохожих контактов — однофамильцы из одного города могут быть разными людьми. Всегда проверяйте email и телефон.
- Игнорирование членства в программе лояльности — убедитесь, что баллы лояльности корректно суммируются.
Массовое объединение через API
Для баз свыше 10 000 контактов ручная работа непрактична. Используйте API для автоматического объединения:
Шаг 1: Получите список дубликатов
GET /api/v1/cdp/contacts/duplicates
Ответ содержит группы дубликатов с ID профилей и степенью совпадения.
Шаг 2: Выполните объединение
POST /api/v1/cdp/contacts/merge
{
"master_id": "uuid-of-master",
"duplicate_ids": ["uuid-1", "uuid-2"]
}
Шаг 3: Автоматизируйте процесс
Напишите скрипт, который:
- Получает список дубликатов через API
- Фильтрует по порогу совпадения (рекомендуем 90%+)
- Автоматически выбирает master (самый полный профиль)
- Выполняет merge пакетами
Совет: Перед массовым объединением экспортируйте базу (CDP, далее Экспорт). Это будет вашей резервной копией на случай ошибок.
Предотвращение дубликатов
Лучшая стратегия — не допускать появления дубликатов:
- Дедупликация при импорте: Trigly автоматически проверяет email при CSV-импорте. Если контакт существует, данные обновляются.
- Identity Resolution: используйте модуль идентификации (CDP, далее Идентификаторы). Привяжите к одному контакту несколько идентификаторов: email, phone, external_id, telegram_chat_id. Trigly автоматически разрешит пересечения.
- SDK identify: при вызове
trigly.identify()SDK автоматически привязывает анонимные события к существующему профилю. - Валидация форм: проверяйте формат email и телефона на стороне клиента до отправки в Trigly.
Влияние на аналитику после объединения
После объединения дубликатов вы заметите изменения в метриках:
- Количество контактов уменьшится (ожидаемо)
- Средний total_revenue увеличится (покупки суммируются)
- RFM-скоринг станет точнее — клиенты переместятся в правильные сегменты
- AI-скоринг пересчитается при следующем запуске (ежедневно в 3:00)
- Data quality score повысится, так как объединенные профили полнее
Рекомендуем после массового объединения запустить принудительный пересчет: RFM, динамические сегменты и оценку качества данных.
Часто задаваемые вопросы
Можно ли отменить объединение? Нет, объединение необратимо. Однако все операции записываются в журнал аудита (ContactChange). Если вы допустили ошибку, создайте новый контакт и перенесите данные вручную. Для массовых операций всегда делайте резервную копию перед началом.
Как часто нужно проверять базу на дубликаты? Рекомендуем проверять после каждого импорта и раз в месяц для текущей базы. Если вы активно используете несколько каналов сбора контактов (сайт, мессенджеры, офлайн), проверяйте чаще.
Объединяются ли данные из программы лояльности? Да. При объединении баллы лояльности суммируются, tier определяется по общему количеству earned-баллов. Транзакции переносятся на master-профиль. Подробнее о программе лояльности читайте в описании возможностей.
Следующие шаги после дедупликации
Объединение контактов — это только начало работы над качеством данных. Вот что рекомендуем сделать после завершения дедупликации:
-
Пересчитайте RFM-сегменты. После объединения профилей данные о покупках суммируются, и клиенты могут переместиться в другие RFM-группы. Запустите пересчёт вручную или дождитесь ночного обновления (3:00).
-
Проверьте триггерные цепочки. Убедитесь, что автоматические flow не отправят дублирующие сообщения объединённым контактам. Если у вас есть активные цепочки с привязкой к конкретным контактам, проверьте их статус.
-
Настройте регулярный мониторинг. Создайте напоминание — раз в месяц проверяйте базу на новые дубликаты. Особенно после массовых импортов и подключения новых каналов сбора контактов.
-
Внедрите Identity Resolution. Это проактивный подход — вместо борьбы с последствиями вы предотвращаете появление дубликатов. Привяжите к каждому контакту несколько идентификаторов (email, телефон, external_id, telegram_chat_id), и Trigly автоматически разрешит пересечения.
-
Оцените качество данных. После дедупликации проверьте data_quality_score базы. Объединённые профили должны иметь более высокий скор за счёт полноты данных. Контакты со скором ниже 30 требуют дополнительного обогащения.
Чистая база без дубликатов — это фундамент, на котором строятся точная аналитика, корректные RFM-сегменты и надёжные предиктивные модели. Инвестируйте время в дедупликацию сейчас — и каждая последующая маркетинговая кампания будет работать эффективнее. По опыту, дедупликация базы из 50 000 контактов обычно выявляет 5-12% дубликатов, и после объединения средний AI-скор клиентов повышается на 8-15 пунктов за счёт более полных профилей.
Попробуйте Trigly бесплатно и наведите порядок в клиентской базе. Регистрация на trigly.ru/register.