Антон М.

Data Science разработчикData ScientistSenior

от 1 600 ₽/ч

Стаж 7 лет

4.2

Навыки подтверждены
нашим экспертом

Основное

Возраст:31 год
Опыт на зарубежных проектах:Не было
Уровень английского:B2

Образование

Хард скиллы

Python7/10

Other9/10

Портфолио

Зарегистироваться и посмотреть репозиторий

Проекты

Jan 2024 - н. в.
2 г., 5 мес.
Decart IT
Проект Крупного ритейла
Реализовано
через RIWO
- Стек проекта
  SQL, Python, pyTorch, DeepPavlov, Catboost, statmodels, Yandex Cloud, S3, MLFlow, Terraform, Kafka, Airﬂow/MLFlow/Docker, SparkML
- Задачи
  Разработка моделей в рамках маркетинговых оптимизаций: модели NPD, элементы рекомендательной системы, векторное представление клиентов на основе чеков. Разработка витрины с более чем 200+ различными признаками и 4 различными модальностями, разработка дорожной карты развития ML решений. Разработка автоматизированной системы оценки А/В тестов с ratio/non-ratio метриками. Менторинг младших коллег. Планирование спринта, оценка нагрузки на команду, помощь в разработки критериев отбора кандидатов. Работа в клиентских стримах ВИП, трафик, отток
- Результат
  Модель NPD: используется для запусков маркетинговых кампаний для определения склонности к посещению в период следующих 7 дней. Витрина признаков: снижение временных затрат на сбор данных для команды ML разработчиков. Система оценки А/В тестов: снижение временных затрат на анализ рекламных кампаний, появилась возможность декомпозиции бизнес метрик + появилось более детальное понимание влияния на поведение клиента. Векторное представление: позволило оптимизировать этап деления клиентских выборок для запуска А/В теста, дополнительные признаки для любых моделей отклика.
- Состав команды
  Ведущий Data Scientist — ответственный за разработку моделей, архитектуру решений и менторинг младших коллег. Data Scientist — участвующий в создании моделей, анализе данных и разработке витрины признаков. Инженер по данным (Data Engineer) — обеспечивающий сбор, обработку и хранение данных (использование SQL, S3, Kafka, SparkML). DevOps-инженер — занимающийся настройкой инфраструктуры и автоматизацией процессов (Terraform, Docker, MLFlow, Yandex Cloud). Специалист по тестированию и аналитике A/B тестов — разрабатывающий автоматизированные системы оценки и анализ эффективности кампаний. Менеджер проекта — планирующий спринты, оценивающий нагрузку и координирующий работу команды. Ментор — поддерживающий развитие младших специалистов и обеспечивающий качество решений.
- Отзыв заказчика
  5.0
  Наталья Ч.
  Всегда старается помочь коллегам и настроен на результат.
  Зарегистироваться и читать полностью
Apr 2023 - Jan 2024
9 мес.
Сбер
Массовая персонализация В2С
Реализовано
через RIWO
- Стек проекта
  SQL, pySpark, pytorch, catboost, shap, SparkML
- Задачи
  Сбор и подготовка данных: сбор данных о клиентах из различных источников (CRM-системы, транзакционные данные, данные о взаимодействии с продуктами и услугами). Очистка и предобработка данных: обработка пропусков, нормализация признаков, создание новых переменных (например, на основе временных меток). Анализ данных: проведение разведывательного анализа данных (EDA) для выявления ключевых факторов, влияющих на поведение клиентов. Использование визуализаций для представления результатов анализа и выявления сегментов клиентов. Сегментация клиентов: применение методов кластеризации (например, K-means или DBSCAN) для группировки клиентов по схожим характеристикам и поведению.
- Результат
  Текущая модель наилучшего времени коммуникации в канале телефон + робот получила 11% прироста CR. Прогноз трат на школьника: модель являлась составляющей масштабного проекта “Ромашка” по предсказанию жизненных ситуаций клиента, наличие данной модели позволило приблизить проект к завершению еще на один шаг.
- Состав команды
  Data Scientist — ведущий аналитик, ответственный за разработку моделей, проведение анализа данных, сегментацию клиентов и создание систем рекомендаций. Data Engineer — специалист по обработке и подготовке данных, реализующий сбор данных из различных источников (CRM, транзакции), а также их очистку и предобработку с использованием SQL, pySpark. Модельер/ML-инженер — занимается разработкой и внедрением моделей машинного обучения (PyTorch, CatBoost), а также их оптимизацией и мониторингом. Специалист по визуализации данных — создает визуальные отчеты и презентации для анализа результатов (например, с помощью SHAP). Инженер по автоматизации и DevOps — обеспечивает автоматизацию процессов обучения моделей, интеграцию решений в системы маркетинга и внедрение CI/CD (использование SparkML, Docker). Специалист по балансировке данных — применяет методы балансировки выборок (SMOTE, oversampling/undersampling) для работы с несбалансированными данными. Бизнес-аналитик/продуктовый менеджер — формулирует требования к моделям, участвует в оценке эффективности и внедрении решений. Менеджер проекта — планирует работу команды, оценивает нагрузку, координирует взаимодействие между участниками. Обучающий/тренер — проводит семинары или тренинги для команды по использованию новых инструментов и моделей.
- Отзыв заказчика
  4.0
  Иван П.
  Отличный командный игрок, быстро вникает в суть проекта.
  Зарегистироваться и читать полностью
Aug 2020 - Jun 2021
9 мес.
Газпромбанк, ОАО
Построение моделей для банковских продуктов
Реализовано
через RIWO
- Стек проекта
  SQL, pySpark, Catboost, shap, sklearn, matplotlib, SparkML
- Задачи
  Сбор и подготовка данных: сбор данных из различных источников, включая CRM-системы, транзакционные данные, данные о клиентах и их взаимодействии с продуктами банка. Очистка и предобработка данных: обработка пропусков, нормализация признаков, создание новых переменных (например, на основе временных меток). Анализ данных: проведение разведывательного анализа данных (EDA) для выявления закономерностей в поведении клиентов и факторов, влияющих на принятие решений.
- Результат
  Модели отклика: сокращение финансовых затрат на маркетинговые кампании в заведомо дорогом канале связи СМС. Система мониторинга: сокращение трудовых затрат сотрудников на отслеживание качества моделей находящихся в проде
- Состав команды
  Data Scientist — ведущий аналитик, ответственный за разработку моделей кредитного скоринга, систем рекомендаций, обнаружения мошенничества и оценки эффективности моделей. Использует инструменты CatBoost, sklearn, SHAP, matplotlib. Data Engineer — специалист по сбору и подготовке данных из различных источников (CRM, транзакции, взаимодействия). Работает с SQL, pySpark для обработки больших объемов данных и автоматизации процессов. ML-инженер / Разработчик моделей — занимается построением и внедрением предсказательных моделей (логистическая регрессия, градиентный бустинг, деревья решений), а также оптимизацией и мониторингом их работы в продакшене (SparkML). Специалист по балансировке данных — применяет методы SMOTE, oversampling/undersampling и модифицированные loss-функции для работы с несбалансированными выборками. Бизнес-аналитик / Продуктовый менеджер — формулирует требования к моделям, оценивает бизнес-эффективность решений, участвует в подготовке отчетов и рекомендаций по внедрению. Инженер по автоматизации и DevOps — обеспечивает автоматизацию процессов обучения моделей, интеграцию решений в системы банка, настройку CI/CD (использование Docker, SparkML). Специалист по визуализации данных — создает отчеты и визуализации для анализа результатов (Matplotlib), помогает выявлять ключевые сегменты клиентов и факторы влияния.
- Отзыв заказчика
  5.0
  Кирилл Н.
  Быстро находит решения и хорошо взаимодействует с коллегами.
  Зарегистироваться и читать полностью
Apr 2020 - Jul 2020
2 мес.
Social Discovery Ventures
Оптимизация рекламных кампаний
- Стек проекта
  CatBoost, sklearn, keras, spaCy, MS SQL
- Задачи
  Сбор и подготовка данных: сбор данных из различных источников, включая платформы цифровой рекламы, веб-аналитику, CRM-системы и базы данных пользователей. Очистка и предобработка данных: обработка пропусков, нормализация признаков, создание новых переменных (например, на основе временных меток или категорий). Анализ данных: проведение разведывательного анализа данных (EDA) для выявления закономерностей в поведении пользователей и факторов, влияющих на конверсию.
- Результат
  Увеличение конверсии: Повышение вероятности выполнения целевых действий пользователями (например, регистрации, покупок) через более точное таргетирование. Оптимизация бюджета: Эффективное распределение рекламного бюджета между различными каналами и кампаниями для максимизации ROI. Персонализация рекламы: Создание персонализированных рекламных предложений на основе анализа поведения пользователей.
- Состав команды
  Data Scientist — ведущий аналитик, ответственный за разработку моделей предсказания конверсии, сегментацию аудитории, анализ факторов влияния и оценку эффективности рекламных стратегий. Использует инструменты CatBoost, sklearn, keras, spaCy. Data Engineer — специалист по сбору и подготовке данных из различных источников (платформы цифровой рекламы, веб-аналитика, CRM-системы, базы данных). Работает с MS SQL и pySpark для обработки больших объемов данных и автоматизации процессов. ML-инженер / Разработчик моделей — занимается построением и внедрением моделей машинного обучения (логистическая регрессия, деревья решений), а также их оптимизацией и мониторингом в продакшене. Специалист по кластеризации и сегментации — применяет методы кластеризации (K-means, DBSCAN) для группировки пользователей по схожим характеристикам и поведению, помогает определить целевые сегменты. Специалист по визуализации данных — создает отчеты и визуализации для анализа результатов (например, с помощью Matplotlib), помогает выявлять ключевые сегменты аудитории и факторы влияния. Бизнес-аналитик / Маркетолог — формулирует требования к моделям и аналитике, участвует в интерпретации результатов A/B-тестов, разрабатывает рекомендации по оптимизации рекламных кампаний.
Mar 2019 - Apr 2020
1 г., 1 мес.
Центр развития экономики, ОАО
Разработка элементов рекомендательной системы
- Стек проекта
  pandas, numpy, scikit-learn, catboost, keras, sql
- Задачи
  Сбор и подготовка данных: сбор данных о пользователях, их взаимодействии с продуктами (например, покупки, просмотры) и демографической информации. Очистка и предобработка данных: обработка пропусков, нормализация признаков, создание новых переменных (например, на основе временных меток). Анализ данных: проведение разведывательного анализа данных (EDA) для выявления закономерностей в поведении пользователей.
- Результат
  Элементы рекомендательной системы: расширение набора признаков для фундаментальной модели, что в свою очередь привело к увеличению точности наших рекомендаций. Анализ подозрительного поведения на площадке: проект позволил выявить признаки, которые в дальнейшем использовались службой безопасности для определения мошенничества. Предиктивная аналитика: модель отклика на маркетинговое предложение, позволила сохранить лояльность клиентов и сократить бюджет на рекламу.
- Состав команды
  Data Scientist / Аналитик данных — ведущий специалист, ответственный за проведение разведывательного анализа (EDA), разработку моделей рекомендаций (коллаборативная фильтрация, контентная фильтрация, гибридные подходы), оценку их качества (RMSE, Precision@K, Recall@K) и анализ подозрительного поведения. Использует pandas, numpy, scikit-learn, catboost, keras. Data Engineer — специалист по сбору и подготовке данных из различных источников (базы данных, платформы). Работает с SQL для извлечения данных, занимается обработкой пропусков, нормализацией признаков и созданием новых переменных. ML-инженер / Разработчик моделей — занимается построением и оптимизацией рекомендательных алгоритмов, внедрением моделей в бизнес-процессы. Использует catboost, keras для разработки гибридных моделей. Специалист по кластеризации — применяет методы K-means или иерархической кластеризации для сегментации пользователей по поведению и характеристикам, помогает определить целевые группы. Специалист по визуализации данных — создает отчеты и графики для представления результатов анализа и оценки эффективности рекомендаций.
Oct 2018 - Mar 2019
4 мес.
ООО Claire&Clarté
Макет аналитической системы для прогноза выхода промышленного оборудования из строя
- Стек проекта
  Ctaboost, Jupyter Notebook, shap
- Задачи
  Сбор и подготовка данных: сбор данных о работе оборудования, включая параметры работы (температура, давление, вибрация), историю ремонтов, технические характеристики и условия эксплуатации. Очистка и предобработка данных: обработка пропусков, нормализация признаков, создание новых переменных (например, на основе временных меток или агрегированных показателей).
- Результат
  Автоматизированная система для заданного набора признаков различных типов (категориальные, непрерывные), которая позволяла для заранее сформированного целевого значения обучать модель отклика. На выходе получался pickle файл с моделью + jupyter ноутбук с графиками, набором метрик, описанием предиктивной силы признаков по shap
- Состав команды
  Data Scientist / Аналитик данных — главный специалист, ответственный за проведение разведывательного анализа (EDA), разработку и обучение моделей машинного обучения (логистическая регрессия, деревья решений, случайный лес), интерпретацию важности признаков (использование SHAP), подготовку отчетов и визуализаций. Использует Jupyter Notebook, shap, scikit-learn, catboost. Data Engineer / Инженер по данным — занимается сбором данных о работе оборудования, ремонтах, технических характеристиках и условиях эксплуатации. Обрабатывает пропуски, нормализует признаки, создает новые переменные и обеспечивает подготовку данных для моделей. Машинный инженер / Разработчик моделей — специализируется на построении и оптимизации моделей прогнозирования с использованием CatBoost и других алгоритмов. Обеспечивает сохранение обученных моделей в pickle-файлы для дальнейшего внедрения. Инженер по временным рядам — занимается анализом изменений в показателях работы оборудования с течением времени, применением методов временных рядов для повышения точности прогнозов. Специалист по визуализации и отчетности — создает графики, отчеты и презентации результатов анализа и оценки модели для внутреннего использования и принятия решений.

Запись видео интервью

Интервью с рекрутером-экспертом RIWO
Зарегистрироваться и смотреть
Техническое интервью
Зарегистрироваться и смотреть

Основное

Образование

Хард скиллы

Портфолио

Проекты

Decart IT

Сбер

Газпромбанк, ОАО

Social Discovery Ventures

Центр развития экономики, ОАО

ООО Claire&Clarté

Запись видео интервью

Похожие специалисты