Разработка моделей в рамках маркетинговых оптимизаций: модели NPD, элементы рекомендательной системы, векторное представление клиентов на основе чеков. Разработка витрины с более чем 200+ различными признаками и 4 различными модальностями, разработка дорожной карты развития ML решений.
Разработка автоматизированной системы оценки А/В тестов с ratio/non-ratio метриками.
Менторинг младших коллег.
Планирование спринта, оценка нагрузки на команду, помощь в разработки критериев отбора кандидатов.
Работа в клиентских стримах ВИП, трафик, отток
Результат
Модель NPD: используется для запусков маркетинговых кампаний для определения склонности к посещению в период следующих 7 дней.
Витрина признаков: снижение временных затрат на сбор данных для команды ML разработчиков.
Система оценки А/В тестов: снижение временных затрат на анализ рекламных кампаний, появилась возможность декомпозиции бизнес метрик + появилось более детальное понимание влияния на поведение клиента.
Векторное представление: позволило оптимизировать этап деления клиентских выборок для запуска А/В теста, дополнительные признаки для любых моделей отклика.
Состав команды
Ведущий Data Scientist — ответственный за разработку моделей, архитектуру решений и менторинг младших коллег.
Data Scientist — участвующий в создании моделей, анализе данных и разработке витрины признаков.
Инженер по данным (Data Engineer) — обеспечивающий сбор, обработку и хранение данных (использование SQL, S3, Kafka, SparkML).
DevOps-инженер — занимающийся настройкой инфраструктуры и автоматизацией процессов (Terraform, Docker, MLFlow, Yandex Cloud).
Специалист по тестированию и аналитике A/B тестов — разрабатывающий автоматизированные системы оценки и анализ эффективности кампаний.
Менеджер проекта — планирующий спринты, оценивающий нагрузку и координирующий работу команды.
Ментор — поддерживающий развитие младших специалистов и обеспечивающий качество решений.
Отзыв заказчика
4.0
Дмитрий А.
Спокойный и уравновешенный исполнитель, с ним удобно работать.
Сбор и подготовка данных: сбор данных о клиентах из различных источников (CRM-системы, транзакционные данные, данные о взаимодействии с продуктами и услугами). Очистка и предобработка данных: обработка пропусков, нормализация признаков, создание новых переменных (например, на основе временных меток). Анализ данных: проведение разведывательного анализа данных (EDA) для выявления ключевых факторов, влияющих на поведение клиентов. Использование визуализаций для представления результатов анализа и выявления сегментов клиентов. Сегментация клиентов: применение методов кластеризации (например, K-means или DBSCAN) для группировки клиентов по схожим характеристикам и поведению.
Результат
Текущая модель наилучшего времени коммуникации в канале телефон + робот получила 11% прироста CR.
Прогноз трат на школьника: модель являлась составляющей масштабного проекта “Ромашка” по предсказанию жизненных ситуаций клиента, наличие данной модели позволило приблизить проект к завершению еще на один шаг.
Состав команды
Data Scientist — ведущий аналитик, ответственный за разработку моделей, проведение анализа данных, сегментацию клиентов и создание систем рекомендаций.
Data Engineer — специалист по обработке и подготовке данных, реализующий сбор данных из различных источников (CRM, транзакции), а также их очистку и предобработку с использованием SQL, pySpark.
Модельер/ML-инженер — занимается разработкой и внедрением моделей машинного обучения (PyTorch, CatBoost), а также их оптимизацией и мониторингом.
Специалист по визуализации данных — создает визуальные отчеты и презентации для анализа результатов (например, с помощью SHAP).
Инженер по автоматизации и DevOps — обеспечивает автоматизацию процессов обучения моделей, интеграцию решений в системы маркетинга и внедрение CI/CD (использование SparkML, Docker).
Специалист по балансировке данных — применяет методы балансировки выборок (SMOTE, oversampling/undersampling) для работы с несбалансированными данными.
Бизнес-аналитик/продуктовый менеджер — формулирует требования к моделям, участвует в оценке эффективности и внедрении решений.
Менеджер проекта — планирует работу команды, оценивает нагрузку, координирует взаимодействие между участниками.
Обучающий/тренер — проводит семинары или тренинги для команды по использованию новых инструментов и моделей.
Отзыв заказчика
5.0
Григорий Ф.
Серьезный подход к работе и отличная коммуникация.
Сбор и подготовка данных: сбор данных из различных источников, включая CRM-системы, транзакционные данные, данные о клиентах и их взаимодействии с продуктами банка. Очистка и предобработка данных: обработка пропусков, нормализация признаков, создание новых переменных (например, на основе временных меток). Анализ данных: проведение разведывательного анализа данных (EDA) для выявления закономерностей в поведении клиентов и факторов, влияющих на принятие решений.
Результат
Модели отклика: сокращение финансовых затрат на маркетинговые кампании в заведомо дорогом канале связи СМС.
Система мониторинга: сокращение трудовых затрат сотрудников на отслеживание качества моделей находящихся в проде
Состав команды
Data Scientist — ведущий аналитик, ответственный за разработку моделей кредитного скоринга, систем рекомендаций, обнаружения мошенничества и оценки эффективности моделей. Использует инструменты CatBoost, sklearn, SHAP, matplotlib.
Data Engineer — специалист по сбору и подготовке данных из различных источников (CRM, транзакции, взаимодействия). Работает с SQL, pySpark для обработки больших объемов данных и автоматизации процессов.
ML-инженер / Разработчик моделей — занимается построением и внедрением предсказательных моделей (логистическая регрессия, градиентный бустинг, деревья решений), а также оптимизацией и мониторингом их работы в продакшене (SparkML).
Специалист по балансировке данных — применяет методы SMOTE, oversampling/undersampling и модифицированные loss-функции для работы с несбалансированными выборками.
Бизнес-аналитик / Продуктовый менеджер — формулирует требования к моделям, оценивает бизнес-эффективность решений, участвует в подготовке отчетов и рекомендаций по внедрению.
Инженер по автоматизации и DevOps — обеспечивает автоматизацию процессов обучения моделей, интеграцию решений в системы банка, настройку CI/CD (использование Docker, SparkML).
Специалист по визуализации данных — создает отчеты и визуализации для анализа результатов (Matplotlib), помогает выявлять ключевые сегменты клиентов и факторы влияния.
Отзыв заказчика
5.0
Максим Ю.
Исполнитель отличается ответственностью и надежностью.
Сбор и подготовка данных: сбор данных из различных источников, включая платформы цифровой рекламы, веб-аналитику, CRM-системы и базы данных пользователей. Очистка и предобработка данных: обработка пропусков, нормализация признаков, создание новых переменных (например, на основе временных меток или категорий). Анализ данных: проведение разведывательного анализа данных (EDA) для выявления закономерностей в поведении пользователей и факторов, влияющих на конверсию.
Результат
Увеличение конверсии: Повышение вероятности выполнения целевых действий пользователями (например, регистрации, покупок) через более точное таргетирование.
Оптимизация бюджета: Эффективное распределение рекламного бюджета между различными каналами и кампаниями для максимизации ROI.
Персонализация рекламы: Создание персонализированных рекламных предложений на основе анализа поведения пользователей.
Состав команды
Data Scientist — ведущий аналитик, ответственный за разработку моделей предсказания конверсии, сегментацию аудитории, анализ факторов влияния и оценку эффективности рекламных стратегий. Использует инструменты CatBoost, sklearn, keras, spaCy.
Data Engineer — специалист по сбору и подготовке данных из различных источников (платформы цифровой рекламы, веб-аналитика, CRM-системы, базы данных). Работает с MS SQL и pySpark для обработки больших объемов данных и автоматизации процессов.
ML-инженер / Разработчик моделей — занимается построением и внедрением моделей машинного обучения (логистическая регрессия, деревья решений), а также их оптимизацией и мониторингом в продакшене.
Специалист по кластеризации и сегментации — применяет методы кластеризации (K-means, DBSCAN) для группировки пользователей по схожим характеристикам и поведению, помогает определить целевые сегменты.
Специалист по визуализации данных — создает отчеты и визуализации для анализа результатов (например, с помощью Matplotlib), помогает выявлять ключевые сегменты аудитории и факторы влияния.
Бизнес-аналитик / Маркетолог — формулирует требования к моделям и аналитике, участвует в интерпретации результатов A/B-тестов, разрабатывает рекомендации по оптимизации рекламных кампаний.
Mar 2019 - Apr 2020
1 г., 1 мес.
Центр развития экономики, ОАО
Разработка элементов рекомендательной системы
Стек проекта
pandas, numpy, scikit-learn, catboost, keras, sql
Задачи
Сбор и подготовка данных: сбор данных о пользователях, их взаимодействии с продуктами (например, покупки, просмотры) и демографической информации. Очистка и предобработка данных: обработка пропусков, нормализация признаков, создание новых переменных (например, на основе временных меток). Анализ данных: проведение разведывательного анализа данных (EDA) для выявления закономерностей в поведении пользователей.
Результат
Элементы рекомендательной системы: расширение набора признаков для фундаментальной модели, что в свою очередь привело к увеличению точности наших рекомендаций.
Анализ подозрительного поведения на площадке: проект позволил выявить признаки, которые в дальнейшем использовались службой безопасности для определения мошенничества.
Предиктивная аналитика: модель отклика на маркетинговое предложение, позволила сохранить лояльность клиентов и сократить бюджет на рекламу.
Состав команды
Data Scientist / Аналитик данных — ведущий специалист, ответственный за проведение разведывательного анализа (EDA), разработку моделей рекомендаций (коллаборативная фильтрация, контентная фильтрация, гибридные подходы), оценку их качества (RMSE, Precision@K, Recall@K) и анализ подозрительного поведения. Использует pandas, numpy, scikit-learn, catboost, keras.
Data Engineer — специалист по сбору и подготовке данных из различных источников (базы данных, платформы). Работает с SQL для извлечения данных, занимается обработкой пропусков, нормализацией признаков и созданием новых переменных.
ML-инженер / Разработчик моделей — занимается построением и оптимизацией рекомендательных алгоритмов, внедрением моделей в бизнес-процессы. Использует catboost, keras для разработки гибридных моделей.
Специалист по кластеризации — применяет методы K-means или иерархической кластеризации для сегментации пользователей по поведению и характеристикам, помогает определить целевые группы.
Специалист по визуализации данных — создает отчеты и графики для представления результатов анализа и оценки эффективности рекомендаций.
Oct 2018 - Mar 2019
4 мес.
ООО Claire&Clarté
Макет аналитической системы для прогноза выхода промышленного оборудования из строя
Стек проекта
Ctaboost, Jupyter Notebook, shap
Задачи
Сбор и подготовка данных: сбор данных о работе оборудования, включая параметры работы (температура, давление, вибрация), историю ремонтов, технические характеристики и условия эксплуатации. Очистка и предобработка данных: обработка пропусков, нормализация признаков, создание новых переменных (например, на основе временных меток или агрегированных показателей).
Результат
Автоматизированная система для заданного набора признаков различных типов (категориальные, непрерывные), которая позволяла для заранее сформированного целевого значения обучать модель отклика. На выходе получался pickle файл с моделью + jupyter ноутбук с графиками, набором метрик, описанием предиктивной силы признаков по shap
Состав команды
Data Scientist / Аналитик данных — главный специалист, ответственный за проведение разведывательного анализа (EDA), разработку и обучение моделей машинного обучения (логистическая регрессия, деревья решений, случайный лес), интерпретацию важности признаков (использование SHAP), подготовку отчетов и визуализаций. Использует Jupyter Notebook, shap, scikit-learn, catboost.
Data Engineer / Инженер по данным — занимается сбором данных о работе оборудования, ремонтах, технических характеристиках и условиях эксплуатации. Обрабатывает пропуски, нормализует признаки, создает новые переменные и обеспечивает подготовку данных для моделей.
Машинный инженер / Разработчик моделей — специализируется на построении и оптимизации моделей прогнозирования с использованием CatBoost и других алгоритмов. Обеспечивает сохранение обученных моделей в pickle-файлы для дальнейшего внедрения.
Инженер по временным рядам — занимается анализом изменений в показателях работы оборудования с течением времени, применением методов временных рядов для повышения точности прогнозов.
Специалист по визуализации и отчетности — создает графики, отчеты и презентации результатов анализа и оценки модели для внутреннего использования и принятия решений.