Перейти к содержимому
Mamba Group
M
Mamba Group
Москва
активна · проверена 2 часа назад

Senior ML Engineer

Mamba Group, создатель крупного dating-сервиса, ищет Senior ML Engineer для построения ML-фабрики. Нужно разрабатывать CV/NLP модели, внедрять MLOps и автоматизировать обучение. Требуется опыт от 4 лет в ML, знание Python и PyTorch. Предлагают удаленку, ДМС и гибкий график.

senior удалённо ~1 790 100 – 2 652 000 ₸
Языки: English · Pre-Intermediate
salary intelligence

Зарплата не указана — оценили по рынку

На основе 5 похожих вакансий за 90 дней.

оценка p25–p75
1 790 100 – 2 652 000 ₸
медиана: 2 154 750 ₸
Хотите увидеть распределение по грейдам и городам? Зарплаты Data/ML Калькулятор зарплат
Вакансии в Telegram-канале
Свежие вакансии Каждый день
Подписаться
??%
Match Score
Войдите и создайте резюме
Войти
описание

Что предстоит делать

Mamba Group — это 20 лет опыта и экспертизы в: • разработке и продвижении highload-проектов; • проектировании и разработке мобильных приложений; • консалтинге в области технической аналитики, монетизации продуктов, пользовательского опыта. Наш ключевой продукт, сервис "Мамба" — highload-проект, один из крупнейших dating-проектов в России и странах ближнего зарубежья. Начиная с 2003 года, Мамба помогает пользователям найти друг друга, создавая для этого лучшие технологии. О проекте Мы развиваем собственную систему разметки данных (СРД) — платформу автоматической классификации контента. В основе системы — большое количество специализированных CV и NLP моделей, каждая из которых отвечает за отдельную задачу: определение объектов, признаков, нарушений, характеристик контента и других категорий. Сейчас перед нами стоит задача масштабировать разработку ML-направления: перейти от разработки отдельных моделей к промышленному процессу создания, обучения, оценки и эксплуатации большого количества моделей. Ищем Senior ML Engineer, который поможет построить культуру MLOps и организовать эффективную ML-фабрику.

  • Разработка CV/NLP/Audio/Video моделей
  • Создавать и улучшать атомарные ML-модели для различных категорий:
  • классификация изображений;
  • object detection;
  • OCR / обработка текста;
  • NLP-классификация;
  • ASR (Automatic Speech Recognition)
  • Video Action Recognition
  • Video Captioning / Summarization
  • multimodal модели (изображения, аудио, видео, текст).
  • Работать с современными архитектурами:
  • CNN;
  • Transformers;
  • Vision Transformers;
  • CLIP-like подходы;
  • foundation models.
  • Построение процесса массового обучения моделей
  • Нам важно не просто обучить одну модель, а создать процесс, позволяющий быстро производить десятки и сотни моделей.
  • Предстоит:
  • проектировать стандартный lifecycle модели;
  • создавать reusable training pipelines;
  • автоматизировать обучение;
  • внедрять единый подход к экспериментам;
  • стандартизировать оценку качества моделей;
  • ускорять вывод моделей в production.
  • Внедрение MLOps культуры
  • Организовать процессы:
  • experiment tracking;
  • model registry;
  • версионирование моделей;
  • контроль качества моделей;
  • управление артефактами обучения;
  • воспроизводимость экспериментов.
  • Настроить процессы:
  • dataset → training → evaluation → model registry → deployment
  • Работа с данными
  • Участвовать в построении правильных процессов подготовки данных:
  • проведение разведочного анализа данных (EDA)
  • формирование обучающих датасетов;
  • организация, контроль и анализ качества разметки;
  • поиск ошибок в данных;
  • работа с дисбалансом классов;
  • hard negative mining;
  • active learning подходы;
  • улучшение моделей через улучшение данных.
  • Production ML
  • Совместно с backend-командой интегрировать модели в production:
  • оценивать необходимые вычислительные ресурсы под рост нагрузки;
  • рассчитывать требования к CPU/GPU инфраструктуре;
  • прогнозировать стоимость inference;
  • проектировать эффективный запуск большого количества моделей;
  • оптимизировать latency и throughput.
  • подготовка моделей к inference;
  • оптимизация скорости работы;
  • мониторинг качества;
  • анализ деградации моделей;
  • обновление версий моделей;
  • документирование ML-моделей (Swagger, Карточки моделей).
  • Что ожидаем
  • Обязательно:
  • опыт 4+ лет в Machine Learning / ML Engineering;
  • опыт доведения ML-моделей до production;
  • уверенное знание Python;
  • опыт с PyTorch;
  • опыт разработки CV и/или NLP решений.
  • Хорошее понимание:
  • как правильно организовать обучение моделей;
  • как выбирать метрики качества;
  • как строить train/validation/test;
  • как анализировать ошибки моделей;
  • как улучшать качество через данные.
  • Опыт с:
  • Transformers;
  • pretrained/foundation models;
  • transfer learning;
  • fine-tuning.
  • Опыт внедрения MLOps инструментов:
  • MLflow;
  • Weights & Biases;
  • Kubeflow;
  • Airflow;
  • DVC.
  • Опыт с:
  • Docker;
  • Kubernetes;
  • FastAPI;
  • Triton Inference Server;
  • model serving.
  • Опыт с инструментами разметки:
  • Label Studio;
  • CVAT.
  • Опыт с большими объемами данных:
  • S3/MinIO;
  • PostgreSQL;
  • vector search / embeddings.
  • Кого мы ищем
  • Нам нужен инженер, который:
  • умеет не только обучать модели, но и строить ML-процессы;
  • понимает разницу между research-кодом и production ML;
  • стремится автоматизировать повторяющиеся задачи;
  • умеет превращать эксперименты в стабильные пайплайны;
  • мыслит системно.
  • Цель роли — построить фундамент, который позволит нашей команде быстро создавать и развивать большое количество моделей.
условия

Что предлагаем

Удаленный формат работы из любой точки мира или комфортный офис в шаговой доступности от станции метро "Цветной бульвар"
Международный ДМС со стоматологией
Корпоративные путешествия (Дагестан, Карелия, Ладога, Красная поляна)
Работу в интересном и большом проекте с невероятно опытной командой
Конкурентную заработную плату по результатам интервью
Гибкое начало рабочего дня, возможность работать из другой страны
Минимум рабочих совещаний и бюрократии
Оплата обучения и участий в конференциях и митапах
Ценные подарки сотрудникам от компании по результатам работы
Скидки и акции у наших партнёров
Аккредитация ИТ-компании в Минцифры
Присоединяйтесь! Мы умеем эффективно работать, весело отдыхать и мы всегда рады новым коллегам!
навыки

Стек и инструменты

Подходит ли вам эта вакансия?

Зарегистрируйтесь и загрузите резюме — посчитаем % совпадения с этой вакансией, подсветим сильные стороны и что стоит подтянуть

Создать аккаунт PDF-парсинг резюме за 2 минуты

Похожие вакансии

6 вакансий
Ozon Банк
O
Ozon Банк
10 ч. назад

Старший портфельный риск-менеджер

~1 790 100 – 2 652 000 ₸ оценка

Ozon Банк ищет старшего портфельного риск-менеджера для управления риск-стратегией B2B кредитования. Требуется опыт в рисках или продуктовой аналитике от 3 лет, знание SQL, Excel, теории вероятностей и матстатистики. Предлагается работа в сильной команде с возможностью влиять на процессы.

риск-менеджмент B2B кредитование +15
senior удал. hh
Deeplay
D
Deeplay
1 д. назад

Product Analyst [Senior / Lead]

~3 266 432 – 3 739 502 ₸ оценка

Deeplay ищет Senior/Lead Product Analyst для работы над антифродом и поведенческой аналитикой. Нужен опыт от 3 лет, Python, SQL, умение формулировать гипотезы и влиять на продуктовые решения. Предлагают удалённую работу или офисы в Омске/Новосибирске, гибкий график и перспективу роста до Data Product Manager.

SQL Python продуктовая аналитика +5
senior удал. hc
deeplay
D
deeplay
1 д. назад

Fraud Analytics [Senior / Lead]

~3 266 432 – 3 739 502 ₸ оценка

Ищем опытного аналитика по антифроду и риск-аналитике для развития систем защиты и поведенческой аналитики. Требуется сильный SQL, Python и понимание ML. Предлагаем гибкий график, удаленку и возможность роста до Data Product Manager.

SQL Python антифрод +5
senior удал. hc
deeplay
D
deeplay
1 д. назад

Product Manager [Senior]

~3 266 432 – 3 739 502 ₸ оценка

Ищем Senior Product Manager для развития data-продуктов в области антифрода и поведенческой аналитики. Требуется 4+ лет опыта в управлении продуктами, особенно в data и ML, уверенный SQL и понимание ML-метрик. Предлагаем удалённую работу или офисы в Омске/Новосибирске, гибкий график и высокую степень самостоятельности.

SQL Product Management Data Science +5
senior удал. hc
Альфа-Банк
А
Альфа-Банк
2 д. назад

Senior разработчик Единого Интеграционного Слоя данных

~1 790 100 – 2 652 000 ₸ оценка

Ищем senior-разработчика для лидирования разработки интеграционного слоя данных банка. Нужен опыт от 6 лет, владение Python и BigData стеком. Предлагаем удалёнку, гибкий график, ДМС и возможности роста.

Debezium Kafka Flink +10
senior удал. hh
GNIVC
G
GNIVC
3 д. назад

Senior ML разработчик

~3 266 432 – 3 739 502 ₸ оценка

IT-компания GNIVC ищет Senior ML разработчика для работы над классификатором товарных позиций на основе BERT. Требуется опыт в NLP/ML, PyTorch и PostgreSQL. Предлагают удаленную работу, ДМС и возможности для обучения.

Git PostgreSQL Python +7
senior удал. hc