Перейти к содержимому
К
крупный производитель справочно-информационного ПО
Москва
7 активна · проверена 11 часов назад

ML-разработчик (NLP/LLM)

Ищем опытного ML-разработчика для создания и поддержки высоконагруженных систем инференса LLM и NLP-моделей. Требуется уверенное знание Python, опыт с Kubernetes, Docker, инструментами serving (Triton, vLLM) и оптимизацией производительности. Предлагаем удаленную работу, ДМС и возможности профессионального роста.

senior удалённо ~2 031 000 – 2 843 400 ₸ (300 000 – 420 000 RUR)
Вакансия опубликована 29 дней назад. Может быть уже неактуальна — рекомендуем уточнить статус у работодателя перед откликом.
Языки: English · Pre-Intermediate
salary intelligence

Эта вакансия платит больше рынка

На 82% выше медианы Python по 152 вакансиям за 90 дней.

эта
2 437 200 ₸
медиана
1 362 000 ₸
p25–p75
681 000 – 1 940 850 ₸
Хотите увидеть распределение по грейдам и городам? Зарплаты Python Калькулятор зарплат
Вакансии в Telegram-канале
Свежие вакансии Каждый день
Подписаться
??%
Match Score
Войдите и создайте резюме
Войти
описание

Что предстоит делать

Мы создаем следующее поколение продуктов на основе генеративного AI (LLM, RAG) и классического NLP. Наша цель — не только исследовательские модели, но и их промышленная эксплуатация в масштабе. Мы ищем опытного ML-разработчика, который будет проектировать, строить и поддерживать сложные, высокопроизводительные и отказоустойчивые системы машинного инференса, являющиеся фундаментом для наших AI-решений.

  • Проектирование и разработка систем инференса:
  • Создание микросервисной архитектуры для обслуживания (Serving) LLM, эмбеддинг-моделей и реранкеров с низкой задержкой (low-latency) и высокой пропускной способностью (high-throughput).
  • Оптимизация пайплайнов инференса для масштабирования (горизонтального и вертикального) и обеспечения отказоустойчивости (high availability, fault tolerance).
  • Интеграция ML-сервисов с системами оркестрации (Kubernetes), очередями сообщений и API-гейтвеями.
  • Инжиниринг производительности и надежности (совместно с девопсами):
  • Проведение глубокого бенчмаркинга и профилирования инференса (использование GPU/CPU, память, задержки) для выявления узких мест.
  • Реализация стратегий батчинга, кэширования, динамической балансировки нагрузки и graceful degradation для критически важных сервисов.
  • Настройка мониторинга, алертинга и сбора метрик (латентность, ошибки, utilization) для ML-сервисов.
  • Дообучение и адаптация моделей для продакшена (совместно со специалистами по дообучению)
  • Адаптация и оптимизация (квантование, дистилляция, компиляция) LLM и других NLP-моделей для эффективного запуска в production-среде.
  • Организация пайплайнов дообучения (fine-tuning) с учетом требований к воспроизводимости и версионированию данных и моделей.
  • Поддержка и развитие ML-инфраструктуры (совместно с девопсами и специалистами обслуживания RAG систем):
  • Развитие и поддержка core-компонентов для RAG-систем (векторные базы, ретрайверы, реранкеры) с упором на их производительность и надежность.
  • Участие в формировании лучших практик (MLOps) для развертывания (CI/CD), мониторинга и управления версиями моделей.
требования

Что ждём от вас

  • Опыт работы ML-инженером / MLOps-инженером от 3 лет.
  • Высшее техническое образование (информатика, прикладная математика, Software Engineering).
  • Уверенное знание Python и его экосистемы для ML/инжиниринга.
  • Понимание принципов разработки высоконагруженных и отказоустойчивых распределенных систем.
  • Производственный опыт развертывания и обслуживания ML-моделей: Знание инструментов для serving'a (Ray Serve, Triton Inference Server, KServe, vLLM, TGI).
  • Глубокое знание инфраструктурного стека:
  • Контейнеризация и оркестрация: Продвинутый опыт с Docker и Kubernetes (Deployments, Services, HPA, ресурсные ограничения).
  • Мониторинг и логирование: Опыт настройки Prometheus, Grafana, ELK Stack для ML-сервисов.
  • Проектирование API: Разработка gRPC и REST API для ML-сервисов, понимание идемпотентности, стратегий retry.
  • Навыки оптимизации: Опыт профилирования и ускорения инференса (использование CUDA, TensorRT, ONNX Runtime, профайлеры типа PyTorch Profiler).
  • Опыт работы с полным циклом LLM/RAG (сильное преимущество):
  • Практический опыт промпт-инжиниринга, дообучения (fine-tuning, LoRA) и запуска инференса LLM.
  • Понимание и опыт реализации производительных и надежных RAG-архитектур (работа с векторными БД, оптимизация пайплайнов поиска и ранжирования).
  • Базовые знания Big Data-стэка (Spark) для обработки данных обучения.
  • Знание фреймворков глубокого обучения (например PyTorch) и библиотек (Transformers, Hugging Face).
условия

Что предлагаем

трудоустройство в соответствии с ТК РФ
Заработная плата обсуждается по результатам собеседования и зависит от профессионального уровня кандидата
Премии - по результатам работы
Медицинское страхование (ДМС)
Возможность профессионального развития и карьерного роста
Офис в Москве, но работа удаленно.
Рабочий день с 10 до 18 часов.
навыки

Стек и инструменты

Подходит ли вам эта вакансия?

Зарегистрируйтесь и загрузите резюме — посчитаем % совпадения с этой вакансией, подсветим сильные стороны и что стоит подтянуть

Создать аккаунт PDF-парсинг резюме за 2 минуты

Похожие вакансии

6 вакансий
Р
РГП Национальный центр геодезии и пространственной информации
12 ч. назад

IT-специалист (Python разработчик GIS/AI)

300 000 – 440 000 ₸

Ищем Python-разработчика для цифровой трансформации геодезии и картографии. Нужно создавать GIS-решения, автоматизировать обработку пространственных данных и внедрять AI. Предлагают гибкий график, удаленку и работу над масштабными проектами.

Python PostgreSQL PostGIS +22
middle удал. hh
RDP
R
RDP
11 ч. назад

Embedded разработчик

~1 489 400 – 2 200 250 ₸ оценка

Ищем опытного Python-разработчика для работы над embedded-системами на Linux. Нужно разрабатывать сервисы удалённого управления, сопровождать ПО, участвовать в troubleshooting и развитии продукта. Предлагаем удалённую работу с редкими командировками в Москву, ДМС и обучение за счёт компании.

Python Linux Embedded +10
senior удал. hh
Хекслет
Х
Хекслет
11 ч. назад

Автор курса по LLM-разработке

~1 489 400 – 2 200 250 ₸ оценка

Создание практического курса по LLM-разработке от основ до продакшн-внедрения. Нужен автор с реальным опытом внедрения LLM-приложений, RAG и AI-агентов. Предлагается удалённая проектная работа.

LLM RAG AI-агенты +4
senior удал. hh
А
АИМОР
1 д. назад

Backend Software Engineer

~1 489 400 – 2 200 250 ₸ оценка

Ищем опытного бэкенд-разработчика для создания и поддержки хостинг и VPN сервисов. Требуется 5+ лет опыта, отличное знание Python (Django/DRF) и Go, опыт с платежными системами и API. Предлагаем удаленную работу, полную занятость и конкурентную оплату.

Python Django DRF +10
senior удал. hh
Bell Integrator
B
Bell Integrator
1 д. назад

Backend разработчик Python/Java

Разработка и поддержка микросервисных интеграционных систем для банковского сектора. Требуется опыт от 5 лет в Python или Java, знание архитектурных паттернов, контейнеризации и брокеров сообщений. Компания предлагает удаленную работу, карьерный рост и участие в масштабных проектах.

Python Java Backend +11
senior удал. hh
АЙ-ТЕКО
А
АЙ-ТЕКО
1 д. назад

Python разработчик

~1 489 400 – 2 200 250 ₸ оценка

Ищем опытного Python-разработчика для создания сервисов на базе больших языковых моделей и AI-агентов. Требуется глубокий опыт в Python, AI/ML и работе с LLM. Компания предлагает стабильную занятость, соцпакет и возможности для профессионального роста.

Python LLM AI +18
senior удал. hh