CDP и клиентские данные: полное руководство [2026]
Исчерпывающее руководство по CDP: единый профиль клиента, сегментация, RFM-анализ, AI-скоринг, lifecycle, data quality, identity resolution и выбор CDP.
CDP и клиентские данные: полное руководство [2026]
Customer Data Platform (CDP) — это платформа, которая собирает данные о клиентах из всех источников, объединяет их в единый профиль и делает доступными для маркетинга, аналитики и персонализации. В эпоху, когда клиент взаимодействует с брендом через 5-8 каналов, CDP стала фундаментом эффективного маркетинга.
По данным CDP Institute, рынок CDP в 2025 году превысил 2.4 миллиарда долларов и продолжает расти на 25-30% ежегодно. В России интерес к CDP резко вырос после ужесточения требований к хранению персональных данных и развития омниканального маркетинга.
В этом руководстве мы разберём все аспекты CDP: от базовых концепций до продвинутых техник работы с клиентскими данными — RFM-анализа, AI-скоринга, identity resolution и оценки качества данных.
Содержание
- Что такое CDP
- CDP vs CRM vs DMP
- Единый профиль клиента
- Сегментация
- RFM-анализ
- AI-скоринг
- Lifecycle: жизненный цикл клиента
- Data quality: качество данных
- Identity resolution
- Import/Export данных
- Computed fields: вычисляемые поля
- Выбор CDP
- FAQ
Что такое CDP
CDP (Customer Data Platform) — это программная система, которая:
- Собирает данные о клиентах из множества источников: сайт, CRM, email, мессенджеры, офлайн-точки, мобильное приложение
- Объединяет данные в единый профиль каждого клиента (identity resolution)
- Хранит полную историю взаимодействий
- Активирует данные — делает их доступными для маркетинга, персонализации и аналитики в реальном времени
Ключевые характеристики CDP
Централизованное хранение: Все данные о клиенте — в одном месте. Не нужно переключаться между CRM, email-платформой, аналитикой и базой данных.
Полная история: CDP хранит не только текущее состояние, но и всю историю взаимодействий: каждый просмотр, клик, покупку, обращение в поддержку.
Real-time обновление: Данные обновляются в режиме реального времени. Когда клиент совершает покупку, его профиль мгновенно обновляется, сегменты пересчитываются, и автоматизации получают актуальные данные.
Открытый доступ: CDP предоставляет API для доступа к данным из любой внешней системы. Это отличает CDP от закрытых экосистем.
CDP vs CRM vs DMP
Три аббревиатуры часто путают. Разберём различия:
| Параметр | CDP | CRM | DMP |
|---|---|---|---|
| Основная задача | Объединение данных для маркетинга | Управление продажами и отношениями | Таргетинг рекламы |
| Тип данных | 1st, 2nd, 3rd party | 1st party (ручной ввод) | 3rd party (cookie) |
| Идентификация | Известные + анонимные | Только известные | Преимущественно анонимные |
| Хранение | Неограниченное | Ограниченное | 90 дней (cookie) |
| Пользователь | Маркетолог | Продажи | Медиабайер |
| Обновление | Real-time | Ручное/полуавтоматическое | Пакетное |
| Профиль | Полный (360 градусов) | Контактный (сделки) | Сегментный |
| API | Открытый | Ограниченный | Ограниченный |
Когда нужна CDP, а не CRM
CRM достаточно, если:
- У вас до 1000 клиентов
- Продажи через прямой контакт (B2B)
- Нет онлайн-каналов маркетинга
CDP необходима, когда:
- База более 5000 клиентов
- Множество каналов коммуникации (email, SMS, Telegram, WhatsApp, push)
- Нужна поведенческая сегментация и персонализация
- Маркетинг основан на данных, а не интуиции
- Требуется автоматизация маркетинговых коммуникаций
Подробнее о рынке CDP в России — в статье CDP: рынок России 2026 и CDP: что это и как выбрать.
Единый профиль клиента
Единый профиль (Customer 360, Unified Profile) — центральное понятие CDP. Это полная картина клиента, собранная из всех источников данных.
Структура профиля в Trigly
Профиль клиента в Trigly содержит 45+ полей, организованных в категории:
Идентификация:
- email (основной идентификатор)
- phone
- external_id (ID из внешней системы)
- telegram_chat_id
- whatsapp_phone
Персональные данные:
- first_name, last_name
- city, country
- timezone, language
Поведенческие данные:
- total_revenue — общая сумма покупок
- total_orders — количество заказов
- last_activity_at — дата последней активности
- avg_order_value — средний чек
- purchase_frequency_days — частота покупок в днях
- first_purchase_at, last_purchase_at
AI-оценки:
- ai_score (0-100) — комплексная AI-оценка ценности
- rfm_recency, rfm_frequency, rfm_monetary — RFM-квинтили
- rfm_score — комбинированный RFM-балл
- rfm_segment — текстовое название сегмента
- lifecycle_stage — этап жизненного цикла
Метаданные:
- source — источник привлечения
- utm_source, utm_medium, utm_campaign — UTM-метки
- tags — массив тегов (JSONB)
- custom_fields — произвольные поля (JSON)
- data_quality_score — оценка качества данных (0-100)
Канальные предпочтения:
- preferred_channel — предпочтительный канал
- channel_preferences — настройки подписки по каналам (JSON)
- push_subscription — данные подписки на push (JSON)
- is_unsubscribed — глобальная отписка
Профиль 360 градусов
В Trigly ProfileService формирует полный обзор клиента (Customer 360), объединяя:
- Профильные данные из PostgreSQL
- Историю событий из ClickHouse
- Участие в сегментах
- Историю кампаний и сообщений
- Программы лояльности
- AI-прогнозы (churn probability, predicted LTV)
Это позволяет маркетологу видеть полную картину клиента в одном интерфейсе.
Сегментация
Сегментация — разделение клиентской базы на группы по определённым критериям для таргетированных коммуникаций. CDP обеспечивает сегментацию на принципиально другом уровне по сравнению с обычными email-платформами.
Подробное руководство по сегментации — в статье Сегментация: полное руководство.
Статическая сегментация
Статические сегменты — это фиксированные списки клиентов. Клиенты добавляются и удаляются вручную или через импорт. Пример: «Участники конференции 2025», «VIP-клиенты Q1 2026».
Применение:
- Одноразовые кампании
- Списки исключений
- Тестовые группы для A/B тестов
Динамическая сегментация
Динамические сегменты определяются набором правил и автоматически обновляются при изменении данных клиента. В Trigly пересчёт происходит каждые 30 минут через Celery task refresh_dynamic_segments.
Примеры правил:
| Правило | Поле | Оператор | Значение |
|---|---|---|---|
| Активные покупатели | total_orders | >= | 3 |
| Высокий чек | avg_order_value | >= | 5000 |
| Москва | city | == | "Москва" |
| Недавняя активность | last_activity_at | within_days | 30 |
| С тегом VIP | tags | contains | "vip" |
Правила можно комбинировать через AND/OR/NOT для построения сложных сегментов. Подробнее — в статье Как настроить динамические сегменты.
Поведенческая сегментация
Сегментация на основе событий из ClickHouse:
- Клиенты, посещавшие страницу /pricing за последние 7 дней
- Клиенты, добавившие товар в корзину, но не купившие
- Клиенты с 5+ сессиями за месяц
- Клиенты, кликнувшие по ссылке в последней рассылке
AI-сегментация (кластеризация)
Trigly использует K-Means кластеризацию для автоматического обнаружения естественных групп клиентов по RFM-признакам. AI определяет оптимальное количество кластеров (4-8) через silhouette score и даёт каждому кластеру описательное название через LLM.
Overlap-анализ
Overlap-анализ показывает пересечение между сегментами. Это критически важно для:
- Предотвращения дублирования коммуникаций
- Понимания структуры аудитории
- Оптимизации таргетинга кампаний
RFM-анализ
RFM-анализ (Recency, Frequency, Monetary) — один из самых мощных инструментов сегментации для e-commerce и подписочных бизнесов.
Подробное практическое руководство — в статье RFM-анализ на практике и в how-to по RFM-сегментации.
Три измерения RFM
Recency (давность) — когда была последняя покупка: Чем недавнее покупка, тем выше вероятность повторной. Клиент, купивший вчера, ценнее клиента, купившего год назад.
Frequency (частота) — как часто покупает: Частота покупок коррелирует с лояльностью. Клиент с 10 покупками лояльнее клиента с 1 покупкой.
Monetary (денежный) — сколько тратит: Совокупная сумма покупок отражает экономическую ценность клиента.
Квинтильная оценка
В Trigly каждое измерение делится на 5 квинтилей (1-5), где 5 — лучший результат. Итого: RFM-балл от 1-1-1 (худший) до 5-5-5 (лучший).
RFM-сегменты
На основе комбинации R, F, M клиенты группируются в понятные бизнес-сегменты:
| Сегмент | R | F | M | Описание | Стратегия |
|---|---|---|---|---|---|
| Чемпионы | 5 | 5 | 5 | Покупают часто, много, недавно | VIP-программа, early access |
| Лояльные | 3-4 | 4-5 | 4-5 | Часто покупают, тратят много | Cross-sell, лояльность |
| Потенциально лояльные | 4-5 | 2-3 | 2-3 | Недавние, начинающие | Nurturing, рекомендации |
| Новые | 5 | 1 | 1 | Только что пришли | Welcome-серия, обучение |
| Перспективные | 3-4 | 1-2 | 1-2 | Немного покупок, но активны | Стимулирование повторных |
| Нужно внимание | 2-3 | 2-3 | 2-3 | Средние по всем показателям | Персональные промо |
| Засыпающие | 2 | 2-3 | 2-3 | Покупали, но давно | Реактивация |
| В зоне риска | 1-2 | 3-5 | 3-5 | Были лояльны, уходят | Агрессивная реактивация |
| Спящие | 1 | 1-2 | 1-2 | Давно нет активности | Последний шанс |
| Потерянные | 1 | 1 | 1 | Полностью ушли | Удаление или финальная попытка |
В Trigly RFM пересчитывается автоматически каждую ночь через Celery task recalculate_rfm (3:00 AM). Вместе с RFM обновляются lifecycle stage, computed fields и data quality score.
Применение RFM в маркетинге
| RFM-сегмент | SMS | Telegram | Скидка | Контент | |
|---|---|---|---|---|---|
| Чемпионы | Premium newsletter | Только важное | Эксклюзив | Не нужна | VIP, early access |
| Лояльные | 2-3/неделю | Акции | Новинки | 5-10% | Рекомендации, cross-sell |
| Засыпающие | Реактивация | Напоминание | — | 15-25% | «Мы скучаем» |
| В зоне риска | Срочная реактивация | Лучшее предложение | Персональное | 25-40% | Win-back |
AI-скоринг
AI-скоринг присваивает каждому клиенту числовую оценку (0-100), отражающую его ценность и вовлечённость. В отличие от RFM, AI-скоринг учитывает больше факторов и использует машинное обучение для взвешивания.
Подробнее о AI в маркетинге — в полном руководстве по AI.
Компоненты AI-скора
Базовая модель (без событий ClickHouse):
| Компонент | Вес | Что оценивает |
|---|---|---|
| Engagement | 30% | Открытия, клики, ответы |
| Monetary | 30% | Сумма покупок, средний чек |
| Recency | 20% | Давность последней активности |
| Loyalty | 20% | Длительность подписки, участие в программе |
Расширенная модель (с событиями ClickHouse):
| Компонент | Вес | Что оценивает |
|---|---|---|
| Engagement | 25% | Поведенческие данные из CH |
| Monetary | 25% | Транзакционные данные |
| Recency | 20% | Давность активности |
| Loyalty | 15% | Длительность и глубина отношений |
| Diversity | 15% | Разнообразие каналов и типов взаимодействий |
Применение AI-скора
- Приоритизация — высокоскоровые клиенты получают VIP-обслуживание
- Бюджетирование — распределение маркетингового бюджета пропорционально скору
- Сегментация — создание сегментов на основе диапазонов скора
- Прогнозирование — корреляция скора с вероятностью покупки и оттока
- Персонализация — адаптация предложений под уровень скора
AI-скор обновляется регулярно через Celery task recalculate_ai_scores. Маркетолог может в любой момент видеть текущий скор каждого клиента и динамику его изменения.
Lifecycle: жизненный цикл клиента
Lifecycle management — управление клиентом на каждом этапе его жизненного цикла. CDP автоматически определяет текущий этап и помогает перевести клиента на следующий.
Этапы жизненного цикла
| Этап | Описание | Критерии (в Trigly) | Цель маркетинга |
|---|---|---|---|
| New | Только зарегистрировался | Нет покупок, <30 дней | Онбординг, первая покупка |
| Active | Регулярно взаимодействует | Есть покупки, активность <30 дней | Развитие, cross-sell |
| Loyal | Постоянный клиент | 5+ покупок, высокий RFM | Удержание, VIP |
| At Risk | Начинает уходить | Снижение активности 30-60 дней | Реактивация |
| Churned | Ушёл | Нет активности 90+ дней | Win-back или удаление |
Автоматическое определение этапа
В Trigly LifecycleService автоматически определяет и обновляет lifecycle stage каждого клиента при пересчёте RFM (ежедневно в 3:00 AM). Логика учитывает:
- Дату последней активности
- Количество заказов
- RFM-сегмент
- Тренд активности (растёт / падает / стабильна)
Автоматизация по lifecycle
Каждый переход между этапами может быть триггером для автоматизации:
- New → Active: поздравление с первой покупкой, рекомендации
- Active → Loyal: приглашение в VIP-программу
- Active → At Risk: реактивационная серия
- At Risk → Churned: финальное предложение
- Churned → Active: welcome-back серия
Data quality: качество данных
Качество данных напрямую влияет на эффективность маркетинга. По оценкам Gartner, плохое качество данных обходится компаниям в среднем в 12.9 миллионов долларов в год.
Подробнее о работе с качеством данных — в статье Как улучшить Data Quality.
Оценка качества в Trigly
DataQualityService рассчитывает score от 0 до 100 для каждого клиента на основе полноты заполнения ключевых полей:
| Поле | Вес в оценке | Комментарий |
|---|---|---|
| Критический | Основной идентификатор | |
| first_name + last_name | Высокий | Персонализация |
| phone | Высокий | Альтернативный канал |
| city | Средний | Гео-сегментация |
| timezone | Средний | Timezone delivery |
| source | Средний | Атрибуция |
| tags | Низкий | Дополнительная категоризация |
| custom_fields | Низкий | Бизнес-специфичные данные |
Интерпретация скора:
- 80-100 — отличное качество, все ключевые поля заполнены
- 60-79 — хорошее качество, есть незначительные пробелы
- 40-59 — среднее качество, требуется обогащение данных
- 0-39 — низкое качество, критические пробелы
Стратегии улучшения качества
1. Прогрессивное профилирование: Не запрашивайте все данные сразу. Собирайте постепенно через:
- Формы подписки (email, имя)
- Post-purchase опросы (город, интересы)
- Preference center (канал, частота)
- Поведенческие данные (автоматически)
2. Валидация при вводе:
- Проверка формата email
- Нормализация телефонных номеров
- Автокомплит города
- Определение timezone по IP
3. Обогащение данных:
- Гео-данные по IP
- Социальные профили по email
- Данные из CRM-интеграций
4. Очистка дубликатов: В Trigly MergeService автоматически обнаруживает дубликаты по email, phone и external_id. Маркетолог может объединить дубликаты с сохранением истории. Подробнее — в статье Как объединить контакты.
Identity resolution
Identity resolution — процесс объединения данных из разных источников в единый профиль клиента. Один и тот же клиент может быть известен как:
- email: ivan@example.com (из формы подписки)
- phone: +79001234567 (из CRM)
- telegram_chat_id: 123456789 (из бота)
- cookie_id: abc123 (из трекера на сайте)
Как работает identity resolution в Trigly
Определённая идентификация (Deterministic): Точное совпадение по уникальным идентификаторам:
- email = email → merge
- phone = phone → merge
- external_id = external_id → merge
IdentityService в Trigly управляет множественными идентификаторами для каждого клиента через модель ContactIdentity:
- Один клиент может иметь несколько идентификаторов (email, phone, external_id, cookie)
- При получении нового события система ищет существующий контакт по всем известным идентификаторам
- Если найден — данные обогащают существующий профиль
- Если не найден — создаётся новый контакт
Практический пример
- Клиент подписывается через форму: создаётся контакт с email
- Тот же клиент звонит в колл-центр: CRM передаёт phone → identity resolution связывает phone с email → один профиль
- Клиент подключает Telegram: бот привязывает chat_id → профиль обогащается
- Клиент совершает покупку: external_id из 1С → полный профиль с омниканальной историей
Import/Export данных
Импорт контактов
Trigly поддерживает импорт контактов из CSV с дедупликацией. Процесс:
- Upload — загрузка CSV-файла
- Preview — предпросмотр данных и маппинг колонок
- Start — запуск импорта с дедупликацией
- Status — отслеживание прогресса в реальном времени
Возможности импорта:
- Автоматический маппинг колонок по названиям
- Дедупликация по email/phone/external_id
- Обновление существующих контактов (upsert)
- Присвоение тегов при импорте
- Добавление в сегмент при импорте
- Обработка кодировок (UTF-8, CP-1251)
Пошаговое руководство — в статье Как импортировать контакты.
Экспорт данных
Trigly поддерживает экспорт контактов и сегментов в CSV и JSON форматы:
- Экспорт всей базы или конкретного сегмента
- Выбор полей для экспорта
- Фоновая генерация файла
- Скачивание через API
Подробнее — в статье Как экспортировать данные.
API и SDK
Для real-time интеграции Trigly предоставляет REST API (290 эндпоинтов) и JavaScript SDK:
- Track — отслеживание событий
- Identify — идентификация клиента
- Batch — пакетная отправка событий
API-ключи управляются через интерфейс с возможностью ограничения прав. Подробнее — в статье Как настроить API ключи и SDK.
Computed fields: вычисляемые поля
Вычисляемые поля — это поля профиля клиента, которые рассчитываются автоматически на основе истории взаимодействий и транзакций.
Вычисляемые поля в Trigly
| Поле | Формула | Обновление |
|---|---|---|
avg_order_value |
total_revenue / total_orders | При каждой покупке |
purchase_frequency_days |
Среднее количество дней между покупками | При каждой покупке |
days_since_last_purchase |
(now - last_purchase_at).days | Ежедневно |
data_quality_score |
Weighted completeness of key fields | Ежедневно |
ai_score |
ML-модель (engagement + monetary + recency + loyalty) | По расписанию |
rfm_score |
R×100 + F×10 + M | Ежедневно |
lifecycle_stage |
Rule-based on activity patterns | Ежедневно |
ComputedFieldsService обновляет avg_order_value, purchase_frequency_days и days_since_last_purchase в рамках ежедневного пересчёта RFM.
Применение вычисляемых полей
- Сегментация: создать сегмент «Средний чек > 5000 руб.» на основе avg_order_value
- Персонализация: адаптировать предложение скидки на основе среднего чека
- Триггеры: запустить автоматизацию, когда days_since_last_purchase > 60
- Аналитика: отслеживать динамику purchase_frequency_days по когортам
Выбор CDP
Критерии выбора
| Критерий | Вопросы для оценки |
|---|---|
| Сбор данных | Какие источники поддерживаются? Есть ли SDK? API? |
| Identity resolution | Какие методы объединения профилей? Deterministic? Probabilistic? |
| Сегментация | Динамические сегменты? Поведенческие? RFM? AI? |
| Активация | Какие каналы поддерживаются для отправки сообщений? |
| Аналитика | Real-time? Кастомные отчёты? Когортный анализ? |
| AI/ML | Скоринг? Предиктивная аналитика? Рекомендации? |
| Масштабируемость | Лимиты по контактам? Событиям? API-вызовам? |
| Хранение данных | Где хранятся данные? Соответствие 152-ФЗ? |
| Интеграции | CRM? E-commerce? Рекламные платформы? |
| Стоимость | Модель ценообразования? TCO за 3 года? |
CDP для российского рынка
При выборе CDP для работы на российском рынке дополнительно учитывайте:
- Хранение данных в РФ — требование 152-ФЗ
- Поддержка российских каналов — Telegram, VK, Яндекс
- Поддержка русского языка — интерфейс, документация, поддержка
- Российские интеграции — 1C, Bitrix24, RetailCRM, Яндекс.Метрика
- Оплата в рублях — без валютных рисков
Trigly разработана специально для российского рынка и покрывает все эти требования: хранение данных на серверах в РФ, полная поддержка русского языка, интеграции с российскими системами и рублёвое ценообразование. Подробнее о рынке CDP — в статье CDP: рынок России 2026.
FAQ
1. Чем CDP отличается от базы данных клиентов в CRM?
CDP собирает данные автоматически из всех источников (сайт, email, мессенджеры, офлайн), объединяет их в единый профиль и обновляет в реальном времени. CRM хранит данные, которые вручную вносят менеджеры по продажам. CDP — для маркетинга (автоматизация, персонализация, сегментация), CRM — для продаж (сделки, контакты, задачи). В идеале CDP и CRM интегрированы: CDP обогащает CRM поведенческими данными, CRM передаёт в CDP данные о сделках.
2. Сколько данных нужно для эффективной работы CDP?
Минимальный набор для старта: email + имя + история покупок (если e-commerce). Уже с этими данными вы сможете запустить RFM-сегментацию и базовые автоматизации. Чем больше данных — тем точнее сегментация и персонализация. Оптимальный набор: контактные данные + поведенческие события + транзакции + канальные предпочтения. Для AI-скоринга и предиктивных моделей нужна история минимум 3-6 месяцев.
3. Как обеспечить соответствие CDP требованиям 152-ФЗ?
Ключевые действия:
- Хранить данные на серверах в РФ (Trigly размещается на российских серверах)
- Получать согласие на обработку ПДн перед сбором данных
- Вести реестр согласий (кто, когда, на что)
- Обеспечить возможность удаления данных по запросу клиента
- Уведомить Роскомнадзор об обработке ПДн
- Использовать списки подавления для управления отказами
- Подробнее — в статье GDPR и 152-ФЗ в маркетинге
4. Как мигрировать данные из существующей системы в CDP?
Пошаговый план:
- Экспортируйте данные из текущей системы (CSV, API)
- Очистите данные: удалите дубликаты, невалидные адреса
- Подготовьте маппинг полей (ваши поля → поля CDP)
- Импортируйте данные (как импортировать контакты в Trigly)
- Настройте real-time синтию данных через API/SDK
- Параллельно запустите обе системы на 2-4 недели
- Проверьте целостность данных и переключитесь
5. Какие метрики отслеживать для оценки эффективности CDP?
Ключевые метрики:
- Data Quality Score — средний балл по базе (цель: >70)
- Profile Completeness — процент заполненности ключевых полей (цель: >60%)
- Segment Coverage — процент клиентов, попавших хотя бы в один сегмент (цель: >90%)
- Identity Match Rate — процент успешных объединений профилей
- Time to Activation — время от сбора данных до использования в кампании
- Campaign Lift — улучшение метрик кампаний после внедрения CDP (типично +20-40%)
Заключение
CDP — это не просто база данных. Это стратегическая платформа, которая превращает разрозненные данные в конкурентное преимущество. Единый профиль клиента, динамическая сегментация, RFM-анализ, AI-скоринг и identity resolution — это инструменты, которые позволяют перейти от массового маркетинга к персонализированным 1:1 коммуникациям.
Ключевые принципы работы с CDP:
- Данные — актив — инвестируйте в качество данных с первого дня
- Единый профиль — объединяйте все точки контакта в одном месте
- Сегментируйте умно — используйте динамические сегменты и AI-кластеризацию
- Автоматизируйте — CDP без автоматизации = дорогая база данных
- Измеряйте — отслеживайте data quality score и campaign lift
Trigly — CDP нового поколения для российского рынка. 45+ полей профиля, динамическая сегментация, RFM-анализ, AI-скоринг, identity resolution, омниканальная коммуникация и AI-генерация контента — всё в одной платформе. Начните бесплатно и постройте единый профиль каждого клиента.