AI в маркетинге
8 мин чтения

Как предсказать отток клиентов с помощью машинного обучения

Churn prediction: какие фичи использовать, как обучить модель, как интегрировать прогноз в маркетинг. Gradient Boosting на Python.

К
Команда Trigly
Эксперты по предиктивной аналитике

Зачем предсказывать отток

Удержание клиента в 5 раз дешевле привлечения нового. Это не просто красивая цифра — это математика: если CAC (стоимость привлечения) составляет 5 000 ₽, а стоимость реактивационной кампании для at-risk клиента — 50-200 ₽ (email + Telegram), то каждый удержанный клиент экономит 4 800+ ₽.

Но удержать можно только тех, о чьём уходе вы знаете заранее. Если клиент уже отменил подписку или не покупал 6 месяцев — вернуть его в 10 раз сложнее, чем предотвратить уход. Вот почему churn prediction — одна из самых ценных ML-задач в маркетинге.

Компании с предиктивной моделью оттока показывают на 25-40% ниже churn rate по сравнению с теми, кто реагирует постфактум. В нашем кейсе SaaS-продукта churn снизился с 8% до 4.8% за 4 месяца — это 800 000 ₽/мес saved MRR.

Что такое churn и как его измерять

Churn (отток) — это потеря клиента. Определение зависит от бизнес-модели:

  • SaaS: клиент отменил подписку или не продлил
  • E-commerce: клиент не покупал X дней (обычно 60-90)
  • EdTech: студент бросил курс и не заходил Y дней
  • Мобильное приложение: пользователь удалил приложение или не открывал Z дней

Формула churn rate: Churn Rate = (ушедшие за период / клиенты на начало периода) × 100%

Нормальный monthly churn rate по индустриям:

Индустрия Нормальный churn Проблемный churn
B2B SaaS 3-5% > 7%
B2C SaaS 5-7% > 10%
E-commerce 20-30%/кв > 40%/кв
EdTech 10-15%/кв > 25%/кв

Подход Trigly к churn prediction

Модель

GradientBoostingClassifier из scikit-learn — проверенный алгоритм, который отлично работает на табличных данных. Gradient Boosting последовательно строит ансамбль деревьев решений, где каждое новое дерево исправляет ошибки предыдущих.

Почему GradientBoosting, а не нейросеть? Для табличных данных с 12-20 фичами и базой 1 000-100 000 клиентов GradientBoosting превосходит нейросети по точности, скорости обучения и интерпретируемости. Нейросети сильны на неструктурированных данных (текст, изображения), но для churn prediction классический ML — оптимальный выбор.

Target (целевая переменная): нет активности 60 дней. Это бинарная классификация: 1 = ушёл, 0 = остался. Порог 60 дней подобран эмпирически для большинства бизнесов, но настраивается под вашу специфику.

12 фич (признаков)

Модель использует 12 фич, разделённых на две группы. Это обеспечивает backward compatibility: модель работает даже если доступны только базовые фичи (5 из PostgreSQL), но даёт лучшую точность с полным набором (12 фич).

5 базовых фич (из CDP-профиля в PostgreSQL):

  1. days_since_last_activity — самый сильный предиктор. Чем дольше клиент неактивен, тем выше риск. Корреляция с churn: 0.72
  2. total_orders — количество покупок/транзакций. Клиенты с 5+ покупками чурнят в 3 раза реже
  3. total_revenue — общая сумма. Высокий LTV = низкий churn (клиент получает ценность)
  4. days_since_registration — «возраст» клиента. Новые клиенты (< 30 дней) чурнят чаще — они ещё не сформировали привычку
  5. purchase_frequency_days — средний интервал между покупками. Нерегулярные покупки — сигнал risk

7 поведенческих фич (из ClickHouse — события за 30 дней):

  1. total_events_30d — общее число событий (любые действия). Падение на 50%+ от среднего — сильный сигнал
  2. unique_event_types — разнообразие действий. Клиент, который только логинится, но не использует функции — at risk
  3. email_opens_30d — открытия email. Клиент перестал открывать письма за 2-4 недели до ухода
  4. email_clicks_30d — клики в email. Ещё более точный сигнал вовлечённости
  5. page_views_30d — просмотры страниц. Снижение page views — ранний индикатор
  6. sessions_30d — количество сессий. Частота визитов напрямую коррелирует с retention
  7. avg_events_per_session — глубина сессии. «Зашёл-вышел» vs «провёл 20 минут, использовал 5 фич»

Важность фич (Feature Importance)

По данным обученных моделей, типичное распределение важности:

Фича Важность Комментарий
days_since_last_activity 28% Главный предиктор
total_events_30d 15% Падение активности
sessions_30d 12% Частота визитов
email_opens_30d 10% Вовлечённость в коммуникацию
unique_event_types 9% Широта использования
purchase_frequency_days 8% Регулярность покупок
total_orders 6% Глубина отношений
avg_events_per_session 5% Глубина сессии
total_revenue 3% LTV
остальные 4%

Обучение модели

Модель обучается автоматически через Celery task (train_churn_model). Процесс:

  1. Выборка клиентов из CDP (минимум 500 с историей 3+ месяца)
  2. Формирование target: клиенты без активности 60+ дней → 1 (churn), остальные → 0
  3. Расчёт 12 фич для каждого клиента
  4. Train/test split (80/20)
  5. Обучение GradientBoostingClassifier
  6. Оценка на тестовой выборке (accuracy, precision, recall, F1)
  7. Сохранение модели в memory cache

Модель переобучается автоматически — еженедельно или по расписанию. На базе 5 000+ клиентов обучение занимает < 30 секунд. На 100 000+ — 2-3 минуты.

Типичные метрики качества:

  • Accuracy: 82-88% (зависит от объёма данных и качества фич)
  • Precision: 75-85% (доля реально ушедших среди предсказанных «уйдёт»)
  • Recall: 78-88% (доля выявленных среди реально ушедших)
  • F1: 77-86%

Использование предикции в маркетинге

Прогноз записывается в поле ai_score клиента (0-100 в CDP-профиле). At-risk клиенты (score > 70) автоматически попадают в триггерную цепочку реактивации через Flow Builder.

Пример реактивационной цепочки:

  1. Score 50-70 (Medium Risk): мягкое напоминание — образовательный контент, новые функции, персональные рекомендации
  2. Score 70-85 (High Risk): активная реактивация — персональное предложение, скидка, звонок CSM
  3. Score 85-100 (Critical Risk): агрессивное удержание — максимальная скидка, эскалация на руководство, персональный менеджер

Каждый уровень — отдельная ветка в Flow Builder с разными каналами, контентом и интенсивностью. Smart Channel выбирает оптимальный канал для каждого at-risk клиента.

Как улучшить точность модели

1. Больше данных

С ростом базы от 5 000 до 50 000 клиентов accuracy растёт на 5-8%. Каждый квартал истории добавляет 1-2% точности.

2. Дополнительные фичи

Помимо 12 стандартных фич, можно добавить:

  • NPS/CSAT scores — удовлетворённость клиента
  • Support tickets — количество обращений в поддержку (особенно нерешённых)
  • Billing issues — неудачные платежи, споры
  • Competitor signals — визиты на сайты конкурентов (через UTM-аналитику)

3. Комбинирование с другими моделями

Trigly также обучает LTV-модель и Next Purchase модель. Комбинация трёх предикций даёт полную картину: кто уйдёт, сколько мы потеряем, и когда ожидалась следующая покупка.

4. Правильный target

60 дней неактивности — хороший default, но для вашего бизнеса оптимальный порог может быть другим. SaaS с месячной подпиской: 30 дней. E-commerce с длинным циклом покупки (мебель, авто): 180 дней. Подберите порог на основе анализа реальных данных.

Churn prediction vs RFM-сегментация

Часто спрашивают: зачем нужна ML-предикция, если есть RFM? Это дополняющие, а не конкурирующие инструменты:

Критерий RFM Churn Prediction (ML)
Подход Правила (квинтили) Обучение на данных
Фичи 3 (R, F, M) 12+
Результат Сегмент (Champions, At Risk...) Score 0-100
Точность Средняя Высокая (80-90%)
Настройка Не нужна Авто-обучение
Интерпретируемость Высокая Средняя

Оптимальная стратегия: используйте оба. RFM для стратегической сегментации (5 больших сегментов), ML churn prediction для тактического выявления at-risk клиентов внутри каждого сегмента. В Trigly оба инструмента работают параллельно: rfm_segment и ai_score — два независимых поля в профиле клиента.

Практический чеклист внедрения

  1. Убедитесь, что в CDP минимум 500 клиентов с историей 3+ месяца
  2. Подключите SDK для трекинга событий (login, page_view, feature_used) — это даст 7 поведенческих фич
  3. Запустите обучение модели через Trigly (автоматически через Celery task)
  4. Проверьте метрики качества (accuracy > 80% — хороший результат)
  5. Создайте 3 реактивационные цепочки в Flow Builder (medium/high/critical risk)
  6. Настройте каналы: email обязательно, Telegram рекомендуется, SMS для critical risk
  7. Включите A/B тестирование реактивационных сообщений
  8. Мониторьте: отслеживайте churn rate ежемесячно, сравнивайте с baseline

FAQ

Сколько данных нужно для начала? Минимум — 500 клиентов с историей 3 месяца. При этом accuracy будет 75-80%. С 5 000+ клиентов — 82-88%. С 50 000+ — 88-92%. Модель обучается инкрементально: чем дольше работает, тем точнее становится. Первые результаты доступны через 1-2 часа после запуска.

Что если у нас только email-данные, без событий из продукта? Модель работает и с 5 базовыми фичами (без ClickHouse). Accuracy будет 70-78% — ниже, но всё ещё полезно. Рекомендуем подключить SDK для трекинга событий — это даст +10-15% к точности. Подробнее об интеграции SDK.

Как часто нужно переобучать модель? В Trigly модель переобучается автоматически — еженедельно через Celery task. Для большинства бизнесов этого достаточно. Если у вас сильная сезонность (туризм, подарки), можно увеличить частоту до ежедневной. Модель адаптируется к изменениям в поведении клиентов без ручного вмешательства.


Хотите предсказывать отток и спасать клиентов до того, как они уйдут? Начните с Trigly — ML-модель churn prediction обучается автоматически, at-risk клиенты попадают в реактивационные цепочки, а вы видите результат в снижении churn rate. Все AI-функции доступны начиная с тарифа Growth (9 900 ₽/мес).

churnMLpredictiongradient boostingretention

Готовы автоматизировать маркетинг?

Email, Telegram, SMS, Push из одного окна. AI-копирайтинг. Предикция оттока.

Записаться на аудит

Читайте также