Senior ML Engineer
Mamba Group, создатель крупного dating-сервиса, ищет Senior ML Engineer для построения ML-фабрики. Нужно разрабатывать CV/NLP модели, внедрять MLOps и автоматизировать обучение. Требуется опыт от 4 лет в ML, знание Python и PyTorch. Предлагают удаленку, ДМС и гибкий график.
Зарплата не указана — оценили по рынку
На основе 5 похожих вакансий за 90 дней.
Что предстоит делать
Mamba Group — это 20 лет опыта и экспертизы в: • разработке и продвижении highload-проектов; • проектировании и разработке мобильных приложений; • консалтинге в области технической аналитики, монетизации продуктов, пользовательского опыта. Наш ключевой продукт, сервис "Мамба" — highload-проект, один из крупнейших dating-проектов в России и странах ближнего зарубежья. Начиная с 2003 года, Мамба помогает пользователям найти друг друга, создавая для этого лучшие технологии. О проекте Мы развиваем собственную систему разметки данных (СРД) — платформу автоматической классификации контента. В основе системы — большое количество специализированных CV и NLP моделей, каждая из которых отвечает за отдельную задачу: определение объектов, признаков, нарушений, характеристик контента и других категорий. Сейчас перед нами стоит задача масштабировать разработку ML-направления: перейти от разработки отдельных моделей к промышленному процессу создания, обучения, оценки и эксплуатации большого количества моделей. Ищем Senior ML Engineer, который поможет построить культуру MLOps и организовать эффективную ML-фабрику.
- Разработка CV/NLP/Audio/Video моделей
- Создавать и улучшать атомарные ML-модели для различных категорий:
- классификация изображений;
- object detection;
- OCR / обработка текста;
- NLP-классификация;
- ASR (Automatic Speech Recognition)
- Video Action Recognition
- Video Captioning / Summarization
- multimodal модели (изображения, аудио, видео, текст).
- Работать с современными архитектурами:
- CNN;
- Transformers;
- Vision Transformers;
- CLIP-like подходы;
- foundation models.
- Построение процесса массового обучения моделей
- Нам важно не просто обучить одну модель, а создать процесс, позволяющий быстро производить десятки и сотни моделей.
- Предстоит:
- проектировать стандартный lifecycle модели;
- создавать reusable training pipelines;
- автоматизировать обучение;
- внедрять единый подход к экспериментам;
- стандартизировать оценку качества моделей;
- ускорять вывод моделей в production.
- Внедрение MLOps культуры
- Организовать процессы:
- experiment tracking;
- model registry;
- версионирование моделей;
- контроль качества моделей;
- управление артефактами обучения;
- воспроизводимость экспериментов.
- Настроить процессы:
- dataset → training → evaluation → model registry → deployment
- Работа с данными
- Участвовать в построении правильных процессов подготовки данных:
- проведение разведочного анализа данных (EDA)
- формирование обучающих датасетов;
- организация, контроль и анализ качества разметки;
- поиск ошибок в данных;
- работа с дисбалансом классов;
- hard negative mining;
- active learning подходы;
- улучшение моделей через улучшение данных.
- Production ML
- Совместно с backend-командой интегрировать модели в production:
- оценивать необходимые вычислительные ресурсы под рост нагрузки;
- рассчитывать требования к CPU/GPU инфраструктуре;
- прогнозировать стоимость inference;
- проектировать эффективный запуск большого количества моделей;
- оптимизировать latency и throughput.
- подготовка моделей к inference;
- оптимизация скорости работы;
- мониторинг качества;
- анализ деградации моделей;
- обновление версий моделей;
- документирование ML-моделей (Swagger, Карточки моделей).
- Что ожидаем
- Обязательно:
- опыт 4+ лет в Machine Learning / ML Engineering;
- опыт доведения ML-моделей до production;
- уверенное знание Python;
- опыт с PyTorch;
- опыт разработки CV и/или NLP решений.
- Хорошее понимание:
- как правильно организовать обучение моделей;
- как выбирать метрики качества;
- как строить train/validation/test;
- как анализировать ошибки моделей;
- как улучшать качество через данные.
- Опыт с:
- Transformers;
- pretrained/foundation models;
- transfer learning;
- fine-tuning.
- Опыт внедрения MLOps инструментов:
- MLflow;
- Weights & Biases;
- Kubeflow;
- Airflow;
- DVC.
- Опыт с:
- Docker;
- Kubernetes;
- FastAPI;
- Triton Inference Server;
- model serving.
- Опыт с инструментами разметки:
- Label Studio;
- CVAT.
- Опыт с большими объемами данных:
- S3/MinIO;
- PostgreSQL;
- vector search / embeddings.
- Кого мы ищем
- Нам нужен инженер, который:
- умеет не только обучать модели, но и строить ML-процессы;
- понимает разницу между research-кодом и production ML;
- стремится автоматизировать повторяющиеся задачи;
- умеет превращать эксперименты в стабильные пайплайны;
- мыслит системно.
- Цель роли — построить фундамент, который позволит нашей команде быстро создавать и развивать большое количество моделей.
Что предлагаем
Стек и инструменты
Подходит ли вам эта вакансия?
Зарегистрируйтесь и загрузите резюме — посчитаем % совпадения с этой вакансией, подсветим сильные стороны и что стоит подтянуть
Похожие вакансии
6 вакансий
Старший портфельный риск-менеджер
~1 790 100 – 2 652 000 ₸ оценка
Ozon Банк ищет старшего портфельного риск-менеджера для управления риск-стратегией B2B кредитования. Требуется опыт в рисках или продуктовой аналитике от 3 лет, знание SQL, Excel, теории вероятностей и матстатистики. Предлагается работа в сильной команде с возможностью влиять на процессы.
Product Analyst [Senior / Lead]
~3 266 432 – 3 739 502 ₸ оценка
Deeplay ищет Senior/Lead Product Analyst для работы над антифродом и поведенческой аналитикой. Нужен опыт от 3 лет, Python, SQL, умение формулировать гипотезы и влиять на продуктовые решения. Предлагают удалённую работу или офисы в Омске/Новосибирске, гибкий график и перспективу роста до Data Product Manager.
Fraud Analytics [Senior / Lead]
~3 266 432 – 3 739 502 ₸ оценка
Ищем опытного аналитика по антифроду и риск-аналитике для развития систем защиты и поведенческой аналитики. Требуется сильный SQL, Python и понимание ML. Предлагаем гибкий график, удаленку и возможность роста до Data Product Manager.
Product Manager [Senior]
~3 266 432 – 3 739 502 ₸ оценка
Ищем Senior Product Manager для развития data-продуктов в области антифрода и поведенческой аналитики. Требуется 4+ лет опыта в управлении продуктами, особенно в data и ML, уверенный SQL и понимание ML-метрик. Предлагаем удалённую работу или офисы в Омске/Новосибирске, гибкий график и высокую степень самостоятельности.
Senior разработчик Единого Интеграционного Слоя данных
~1 790 100 – 2 652 000 ₸ оценка
Ищем senior-разработчика для лидирования разработки интеграционного слоя данных банка. Нужен опыт от 6 лет, владение Python и BigData стеком. Предлагаем удалёнку, гибкий график, ДМС и возможности роста.
Senior ML разработчик
~3 266 432 – 3 739 502 ₸ оценка
IT-компания GNIVC ищет Senior ML разработчика для работы над классификатором товарных позиций на основе BERT. Требуется опыт в NLP/ML, PyTorch и PostgreSQL. Предлагают удаленную работу, ДМС и возможности для обучения.