У каждой компании сегодня есть аналитики, дашборды и терабайты данных. Но стратегические решения продолжают часто основываться на интуиции, а не на фактах. Проблема в том, что между сырыми цифрами и практическими выводами лежит огромная пропасть. Особенно ценными становятся специалисты, которые умеют эту пропасть преодолевать. Ксения Лукина — один из таких специалистов. Всего за три года она прошла путь от маркетингового аналитика до Chief Data Officer, создала несколько продуктов с нуля и внедрила технологии, которые раньше никто не применял в её индустриях.
Сегодня в портфолио Ксении — проекты от векторизации пользовательских сообщений до построения атрибуционных моделей по Шепли, от внедрения A/B-тестов в офлайн-образование до создания нейросетей для прогноза LTV в условиях iOS 14.5+. Но главное её достижение — способность объяснить самые сложные алгоритмы простым языком и превратить их в инструменты роста бизнеса.
Мы поговорили с Ксенией о том, как найти баланс между техническим совершенством и коммерческой эффективностью, почему важно быть переводчиком между разработчиками и менеджерами, и какие навыки помогают молодым специалистам становиться лидерами в tech-индустрии.
— Ксения, многие data-специалисты годами остаются в роли аналитиков. Что отличает тех, кто вырастает до стратегических позиций? Какие решения или проекты стали переломными в вашей карьере?
— Главное отличие — умение говорить с бизнесом на их языке. Можно построить самую продвинутую модель машинного обучения, но если ты не можешь объяснить CEO, как она влияет на прибыль компании, твоя работа останется невидимой.
У меня был переломный момент в CAM Edu, когда я предложила полностью переделать воронку продаж. До этого у нас была стандартная форма на две страницы, которую пользователи неохотно заполняли. Я не просто сказала «нужно А/B-тестировать» — я показала конкретные цифры потерь, спроектировала новую архитектуру и объяснила, на сколько вырастет прибыль. Результат — конверсия выросла в 2,3 раза, а я получила карт-бланш к более амбициозным проектам.
Второй переломный момент — когда я начала внедрять Growthbook в офлайн-образование. Никто раньше не применял feature flags к физическим занятиям. Пришлось создавать с нуля систему «цифровых двойников» для офлайн-процессов. Это показало команде, что я могу не просто анализировать данные, а создавать новые подходы к решению бизнес-задач.
— Вы называете себя «переводчиком между кодом и бизнесом». В чём заключается эта роль и почему она так важна в современных компаниях?
— В большинстве компаний есть разрыв: разработчики создают технически совершенные решения, но не понимают бизнес-контекст, а менеджеры видят проблемы, но не знают, как их решить технически.
Я заметила это ещё в CAM Edu. Команда хотела «улучшить аналитику», но когда я спрашивала «что конкретно вы хотите понять о своих клиентах?», четкого ответа не было. А технические коллеги предлагали внедрить CDP или построить хранилище данных, не понимая, зачем это бизнесу.
Моя роль — стать мостом. Я беру бизнес-задачу вроде «хотим увеличить повторные покупки» и превращаю её в техническое задание: какие данные собирать, какие модели строить, какие метрики отслеживать. А потом результаты модели я объясняю менеджерам через KPI, которые им понятны.
Например, когда я внедряла U2V Engine для прогноза LTV, я не рассказывала про автоэнкодеры и LSTM. Я говорила: «Мы можем предсказать ценность пользователя в первые 48 часов с точностью 94%, что позволит тратить рекламный бюджет на 12% эффективнее». Технические детали — для разработчиков, бизнес-результат — для руководства.
— Один из ваших самых необычных проектов — внедрение A/B-тестов в офлайн-образование. Как вообще можно тестировать гипотезы в физическом мире?
— Это был настоящий вызов и точка перехода CAM Edu от традиционной образовательной организации к технологической компании. В цифровой среде у нас есть пользовательские идентификаторы, клики, события — всё структурировано. В офлайне таких «готовых» данных нет. Нужно было создавать цифровую инфраструктуру для физических процессов.
Мы внедрили гибридную архитектуру, связывающую офлайн-процессы с цифровыми системами данных. Вместо привязки флагов к программным элементам мы привязали их к профилям студенческих групп в CRM. Флаги управляли физическими аспектами — расписаниями преподавателей, форматами занятий.
QR-чекины при входе в класс стали нашими «событиями», структурированные отчёты преподавателей заменили пользовательские метрики, а обратная связь родителей — события конверсии. Мы превратили физические классы в контролируемую экспериментальную среду.
Для случайного распределения использовали алгоритмы на основе идентификаторов студентов и временных параметров.
В результате получили не просто A/B-инфраструктуру, а масштабируемую платформу экспериментов, которая изменила ДНК компании. Сегодня эта система — сердце наших операций: она автоматизирует принятие решений, персонализирует образовательные программы и открывает новые возможности для продуктовых линеек. По сути, мы создали собственную технологическую экосистему, которая превратила традиционные образовательные процессы в data-driven продукт.
— Модель атрибуции по Шепли — это довольно продвинутая математика. Как вы убеждали бизнес-команду инвестировать в такие сложные решения?
— Никогда не начинаю с математики — начинаю с боли. В CAM Edu у нас была классическая проблема: мы тратили бюджет на Facebook, Instagram, Google Ads, делали мероприятия, email-рассылки, но не понимали, что реально работает. Модель «последнего клика» показывала, что эффективнее всего Google Ads, потому что люди в итоге гуглят название компании. Но интуитивно мы понимали — они же откуда-то о нас узнали!
Я объяснила проблему через простую аналогию: представьте футбольную команду, где гол засчитывается только тому, кто забил, а всем, кто делал передачи, — ноль очков. Так работает модель последнего клика. А модель Шепли — это справедливая система, которая оценивает вклад каждого игрока в общую победу.
Потом показала конкретные цифры: по старой модели Facebook «не работал» — всего 5% конверсий. По Шепли оказалось, что он участвует в 38% всех продаж, просто люди после него идут гуглить нас. Мы перераспределили бюджет, увеличили инвестиции в Facebook и органические каналы — результат: CAC снизился с $58 до $47, а общее количество лидов выросло на 22%.
Математику я объясняла только техническим коллегам. Для бизнеса важен результат: теперь мы знаем реальную эффективность каждого канала и не тратим деньги впустую.
— В условиях iOS 14.5+ многие маркетологи жалуются на невозможность отслеживать пользователей. Как ваш U2V Engine решает эту проблему?
— iOS 14.5+ действительно перевернул всю мобильную аналитику. Раньше мы могли отследить каждого пользователя индивидуально, теперь Apple даёт только агрегированные данные через SKAdNetwork — грубо говоря, «из этой рекламной кампании пришло 100 человек, 30 из них что-то купили».
Задача была создать модель, которая предсказывает ценность пользователя (LTV) по минимальным данным, доступным в первые 24-48 часов. Традиционные подходы не работали — слишком мало информации.
Я разработала U2V-подход: User-to-Vector. Вместо попыток отследить конкретного пользователя мы создаём «поведенческий отпечаток» на основе его действий в приложении. Какие экраны открывает, в какой последовательности, сколько времени проводит, какие функции использует — всё это упаковывается в вектор через нейросеть.
Потом этот вектор сравнивается с историческими данными: находим пользователей с похожим «отпечатком» и смотрим, какую ценность они принесли через месяц-два. Модель на основе CatBoost с U2V-векторами снизила ошибку прогноза LTV с 6,56% до 6,10% — может показаться мало, но в масштабе рекламных бюджетов это тысячи долларов экономии.
Главное — мы перестали зависеть от пользовательских идентификаторов и научились работать с «анонимными паттернами поведения».
— Вы работали с векторизацией поведения в разных сферах — от мобильных приложений до социальных сетей. Объясните простыми словами: как можно «оцифровать» человеческое поведение в сетевых сообществах?
— Векторизация как подход работает, действительно, в совершенно разных нишах, в том числе и в нише социальных сетей — например, в одном из наших проектов мы анализировали поведение пользователей в Telegram-каналах. Но представьте, что у вас есть тысячи сообщений от пользователей — в чатах, отзывах, обращениях в поддержку. Традиционно мы анализируем их по ключевым словам: сколько раз упомянули «плохо» или «хорошо». Но это поверхностный подход — он не ловит контекст, иронию, эмоциональную окраску.
Я пошла дальше: вместо анализа слов стала анализировать стиль мышления. Передаю в LLM историю сообщений пользователя и прошу не классифицировать их, а создать «психологический портрет»: насколько человек рационален, тревожен, доверчив, как он принимает решения.
На выходе получается вектор — набор чисел, где каждое число отражает определённую черту. Например, [0.8, 0.3, 0.6] может означать «высокая рациональность, низкая тревожность, средний уровень доверия». Такие векторы можно сравнивать между собой, группировать похожих пользователей, предсказывать их реакции.
Проще говоря, вместо того чтобы гадать «понравится ли этому пользователю наш новый продукт», мы смотрим на его вектор и находим похожих людей, которые уже попробовали продукт. Если им понравилось — скорее всего, понравится и ему. Так мы повысили точность рекомендаций на 21% и существенно улучшили персонализацию push-уведомлений.
— За время работы вы удваивали конверсии, снижали стоимость привлечения, повышали точность прогнозов. Какой проект считаете самым значимым и почему?
— Самым значимым считаю внедрение A/B-тестирования в офлайн-образование в CAM Edu. Не из-за технической сложности, а из-за культурного сдвига, с которого, по сути, началась цифровая трансформация компании.
До этого проекта все решения в компании принимались на основе опыта CEO или мнения самого громкого человека в комнате. «Давайте попробуем новый формат занятий» — и весь департамент перестраивался под эксперимент одного человека. Никто не измерял результат, не сравнивал альтернативы.
Я не просто создала техническую инфраструктуру для тестов — я изменила мышление команды. Теперь любое предложение начинается с вопроса «А как мы это проверим?». Новый метод обучения? Тестируем на двух группах. Изменения в коммуникации с родителями? Сравниваем результаты. Даже выбор времени для занятий проходит через эксперименты.
Результат — повторные записи выросли на 12%, заполняемость классов — на 15%, но главное: мы перестали принимать решения вслепую. Этот подход потом масштабировался на другие регионы, и теперь вся компания работает в логике экспериментов.
Конечно, проекты с нейросетями технически интереснее, но именно этот изменил способ работы целой организации. Для меня это важнее красивых алгоритмов. Этот сдвиг в мышлении постепенно позволил перевести компанию на более технологические рельсы. Мы начали естественным образом интегрировать цифровые решения в офлайн-процессы, что открыло путь к гибридной модели образования. Сегодня наша аналитическая инфраструктура поддерживает не только внутренние решения, но и становится основой для новых продуктовых направлений. По сути, мы эволюционировали от традиционной образовательной компании к организации, где технологии и данные определяют стратегию развития. Это отражается и в пользовательском опыте, и в коммерческих показателях — у нас появились цифровые сервисы, автоматизация процессов стала нормой, а решения принимаются на основе экспериментов, а не предположений.
— Что сложнее — создать техническое решение или внедрить его в компании? С какими барьерами приходится сталкиваться?
— Однозначно сложнее внедрить. Код можно написать в изоляции, а внедрение — это работа с людьми, которые сопротивляются изменениям. Главные барьеры: «у нас всегда так работало» — тут помогают пилоты с быстрыми результатами; страх сложности — поэтому я «упаковываю» модель Шепли в «справедливый калькулятор эффективности каналов»; нехватка ресурсов — начинаю с минимальной версии, которая даёт быстрый эффект; и внутренняя политика — когда решение «угрожает» чьей-то экспертизе, делаю коллег соавторами успеха, а не конкурентами.
— Дайте совет для молодых специалистов: как развиваться в data science и перерасти роль «просто аналитика», чтобы влиять на стратегические решения компании?
— Три простых правила. Цените технологии, но влюбляйтесь в проблемы — начинайте с понимания бизнес-боли, а не с желания изучить новый алгоритм. Научитесь рассказывать истории через данные: «конверсия выросла на 15%» звучит лучше, чем «accuracy модели 94%». И будьте автором решений — не ждите технических заданий, сами ищите, что можно улучшить. Не бойтесь быть единственным техническим человеком на бизнес-встречах — именно там ваше мнение может изменить стратегию компании. Помните: аналитик объясняет, что произошло, а стратег предсказывает, что будет, и предлагает, как это изменить.
А в конце концов, самое важное — оставаться человеком, который решает настоящие проблемы. Технологии приходят и уходят, а способность видеть суть задачи и находить для неё элегантное решение — это то, что делает нас незаменимыми. Данные без понимания контекста — просто цифры. Но когда вы научитесь превращать их в инсайты, которые меняют судьбы компаний, — вот тогда вы становитесь тем самым переводчиком между кодом и бизнесом, без которого современные организации просто не могут существовать.