Backend-разработчик платформы инференса ML-моделей
Разработка и оптимизация высоконагруженной платформы для инференса ML-моделей на GPU. Требуется опыт от 4 лет в Go или Java/Kotlin, знание Kubernetes и распределённых систем. Предлагается работа в Ozon над инфраструктурой, обслуживающей миллионы пользователей.
Зарплата не указана — оценили по рынку
На основе 12 похожих вакансий за 90 дней.
Что предстоит делать
Привет! Мы — команда платформы инференса Ozon. Мы строим ML - инфраструктуру, отвечающую за финальный и самый критичный этап жизненного цикла моделей — их работу в реальных продуктах. Через нашу платформу проходят ранжирование, рекомендации, компьютерное зрение и другие ML-сценарии, влияющие на миллионы пользователей. Наша миссия — создавать отказоустойчивую и высокопроизводительную платформу инференса, способную выдерживать пиковую нагрузку 200K+ RPS и эффективно управлять кластерами GPU-серверов. Мы работаем на стыке сильной backend-инженерии (многопоточность, распределённые системы, Kubernetes) и глубокой ML-специфики с фокусом на оптимизацию работы моделей на GPU. Наш стек • Go, Java — платформенные сервисы • Python — ML-интеграции • Kubernetes, Docker, Nvidia Device Plugin • Triton Inference Server • Kafka, PostgreSQL, Redis, S3 • GitLab CI Вы будете • Проектировать и разрабатывать высоконагруженные сервисы для инференса ML-моделей в облачной среде. • Оптимизировать выполнение моделей на GPU: batching, управление GPU-памятью, настройка GPU sharing (MIG), снижение latency. • Интегрировать ML-рантаймы (TensorRT, ONNX Runtime) в платформенную инфраструктуру на Java и Go. • Разрабатывать механизмы автоскейлинга и эффективного распределения нагрузки между инференс-сервисами. • Обеспечивать SLA платформы: участвовать в разборе инцидентов, выявлять узкие места и внедрять системные решения для повышения стабильности и производительности. Примеры задач • Разработка унифицированного API инференса, абстрагирующего команды Data Science от особенностей GPU и рантаймов. • Автоматическая оптимизация и конвертация моделей под различные типы GPU. • Реализация асинхронного инференса с автоскейлингом в Kubernetes. • Повышение утилизации GPU-кластера без деградации latency Нам важно • Коммерческий опыт разработки на Go или Java/Kotlin от 4-х лет. • Опыт проектирования микросервисной архитектуры и работы с распределёнными системами. • Понимание многопоточности и конкурентного программирования. • Умение писать чистый, тестируемый и поддерживаемый код. • Опыт работы с облачной инфраструктурой (желательно Kubernetes). Будет плюсом • Опыт работы с ML-инфраструктурой и GPU (CUDA, Triton, KServe). • Понимание MLOps-практик. • Опыт работы с Kafka или другими системами очередей. • Опыт оптимизации высоконагруженных систем.
Стек и инструменты
Подходит ли вам эта вакансия?
Зарегистрируйтесь и загрузите резюме — посчитаем % совпадения с этой вакансией, подсветим сильные стороны и что стоит подтянуть
Ещё в Ozon
134 активные вакансии в компании
Data Scientist (ML)
~861 900 ₸ оценка
Ищем дата-саентиста для разработки ИИ-сервисов внутри компании. Вы будете работать с современными LLM, дообучать модели, решать задачи NLP и CV. Требуется уверенное владение Python, опыт с PyTorch и классическим ML.
Backend-разработчик Go (middle)
~1 326 000 – 1 989 000 ₸ оценка
Ищем middle Go-разработчика для создания backend-сервисов автоматического ценообразования. Нужно уверенное знание Go, опыт с PostgreSQL и Kafka, готовность разбираться в сложной бизнес-логике. Предлагаем удалённую работу, ежедневные деплои и влияние на продукт.
QA Engineer (Go/TS) — Ozon fresh
~1 127 100 – 1 790 100 ₸ оценка
Вакансия для опытного QA-инженера, который будет писать автотесты на Go и TypeScript, разрабатывать тест-стратегии и поддерживать инфраструктуру тестирования в сервисе быстрой доставки Ozon fresh. Требуется от 4 лет опыта в тестировании и знание микросервисной архитектуры. Предлагают удаленную работу и профессиональное развитие.
Backend-разработчик (Go)
~1 657 500 – 2 320 500 ₸ оценка
Ищем опытного backend-разработчика для развития высоконагруженных сервисов управления товарами и поиском. Стек: Go, PostgreSQL, Kafka, ElasticSearch. Требуется опыт от 3 лет, готовность изучать Go и глубокое знание реляционных БД. Предлагаем работу над ключевыми функциями платформы для продавцов и поисковыми системами.
Похожие вакансии
6 вакансий
Senior Go разработчик
~1 657 500 – 2 320 500 ₸ оценка
Ищем опытного Go-разработчика для создания и улучшения средств интеграции продукта Application Inspector. Нужно разрабатывать новый функционал, принимать архитектурные решения, проводить код-ревью и менторить коллег. Предлагают гибкий график, обучение, ДМС и компенсацию спорта.
Senior Go разработчик
~1 657 500 – 2 320 500 ₸ оценка
Ищем Senior Go-разработчика для создания высоконагруженных backend-сервисов в сфере игорного бизнеса. Требуется опыт от 4-5 лет, уверенное владение Go, микросервисами и PostgreSQL/MySQL. Предлагается удаленная работа, 25 дней отпуска и поддержка профессионального роста.
Go-разработчик видеосервиса
~1 657 500 – 2 320 500 ₸ оценка
VK ищет опытного Go-разработчика для развития видеосервиса и интеграции видеотехнологий в другие продукты. Требуется от 5 лет коммерческой разработки на Go, опыт работы с highload и микросервисами. Предлагается работа над масштабной платформой с миллиардами просмотров.
Главный Golang разработчик
~1 657 500 – 2 320 500 ₸ оценка
Ищем опытного Go-разработчика для создания финансовых сервисов в экосистеме Магнит. Требуется от 3 лет коммерческой разработки на Go и от 5 лет backend-опыта. Предлагаем работу в динамичной команде с короткими циклами и быстрыми релизами.
Backend-разработчик (Go)
~1 657 500 – 2 320 500 ₸ оценка
Ищем опытного backend-разработчика для развития высоконагруженных сервисов управления товарами и поиском. Стек: Go, PostgreSQL, Kafka, ElasticSearch. Требуется опыт от 3 лет, готовность изучать Go и глубокое знание реляционных БД. Предлагаем работу над ключевыми функциями платформы для продавцов и поисковыми системами.
Ведущий разработчик Golang
~1 657 500 – 2 320 500 ₸ оценка
Beeline Cloud ищет ведущего разработчика Golang для создания backend личного кабинета облачной платформы. Вы будете проектировать микросервисы, участвовать в код-ревью и улучшать процессы. Требуется опыт от 5 лет в продуктовой разработке и от 3 лет с Go. Компания предлагает сильную инженерную среду, ДМС и возможности для роста.