крупный производитель справочно-информационного ПО

7 4 нед. назад активна · проверена 11 часов назад

ML-разработчик (NLP/LLM)

Ищем опытного ML-разработчика для создания и поддержки высоконагруженных систем инференса LLM и NLP-моделей. Требуется уверенное знание Python, опыт с Kubernetes, Docker, инструментами serving (Triton, vLLM) и оптимизацией производительности. Предлагаем удаленную работу, ДМС и возможности профессионального роста.

senior удалённо ~2 031 000 – 2 843 400 ₸ (300 000 – 420 000 RUR)

Вакансия опубликована 29 дней назад. Может быть уже неактуальна — рекомендуем уточнить статус у работодателя перед откликом.

Войти и откликнуться hh.kz

Языки: English · Pre-Intermediate

salary intelligence

Эта вакансия платит больше рынка

На 82% выше медианы Python по 152 вакансиям за 90 дней.

эта

2 437 200 ₸

медиана

1 362 000 ₸

p25–p75

681 000 – 1 940 850 ₸

Хотите увидеть распределение по грейдам и городам? Зарплаты Python Калькулятор зарплат

Вакансии в Telegram-канале

Свежие вакансии Каждый день

??%

Match Score

Войдите и создайте резюме

Войти

описание

Что предстоит делать

Мы создаем следующее поколение продуктов на основе генеративного AI (LLM, RAG) и классического NLP. Наша цель — не только исследовательские модели, но и их промышленная эксплуатация в масштабе. Мы ищем опытного ML-разработчика, который будет проектировать, строить и поддерживать сложные, высокопроизводительные и отказоустойчивые системы машинного инференса, являющиеся фундаментом для наших AI-решений.

Проектирование и разработка систем инференса:
Создание микросервисной архитектуры для обслуживания (Serving) LLM, эмбеддинг-моделей и реранкеров с низкой задержкой (low-latency) и высокой пропускной способностью (high-throughput).
Оптимизация пайплайнов инференса для масштабирования (горизонтального и вертикального) и обеспечения отказоустойчивости (high availability, fault tolerance).
Интеграция ML-сервисов с системами оркестрации (Kubernetes), очередями сообщений и API-гейтвеями.
Инжиниринг производительности и надежности (совместно с девопсами):
Проведение глубокого бенчмаркинга и профилирования инференса (использование GPU/CPU, память, задержки) для выявления узких мест.
Реализация стратегий батчинга, кэширования, динамической балансировки нагрузки и graceful degradation для критически важных сервисов.
Настройка мониторинга, алертинга и сбора метрик (латентность, ошибки, utilization) для ML-сервисов.
Дообучение и адаптация моделей для продакшена (совместно со специалистами по дообучению)
Адаптация и оптимизация (квантование, дистилляция, компиляция) LLM и других NLP-моделей для эффективного запуска в production-среде.
Организация пайплайнов дообучения (fine-tuning) с учетом требований к воспроизводимости и версионированию данных и моделей.
Поддержка и развитие ML-инфраструктуры (совместно с девопсами и специалистами обслуживания RAG систем):
Развитие и поддержка core-компонентов для RAG-систем (векторные базы, ретрайверы, реранкеры) с упором на их производительность и надежность.
Участие в формировании лучших практик (MLOps) для развертывания (CI/CD), мониторинга и управления версиями моделей.

требования

Что ждём от вас

Опыт работы ML-инженером / MLOps-инженером от 3 лет.
Высшее техническое образование (информатика, прикладная математика, Software Engineering).
Уверенное знание Python и его экосистемы для ML/инжиниринга.
Понимание принципов разработки высоконагруженных и отказоустойчивых распределенных систем.
Производственный опыт развертывания и обслуживания ML-моделей: Знание инструментов для serving'a (Ray Serve, Triton Inference Server, KServe, vLLM, TGI).
Глубокое знание инфраструктурного стека:
Контейнеризация и оркестрация: Продвинутый опыт с Docker и Kubernetes (Deployments, Services, HPA, ресурсные ограничения).
Мониторинг и логирование: Опыт настройки Prometheus, Grafana, ELK Stack для ML-сервисов.
Проектирование API: Разработка gRPC и REST API для ML-сервисов, понимание идемпотентности, стратегий retry.
Навыки оптимизации: Опыт профилирования и ускорения инференса (использование CUDA, TensorRT, ONNX Runtime, профайлеры типа PyTorch Profiler).
Опыт работы с полным циклом LLM/RAG (сильное преимущество):
Практический опыт промпт-инжиниринга, дообучения (fine-tuning, LoRA) и запуска инференса LLM.
Понимание и опыт реализации производительных и надежных RAG-архитектур (работа с векторными БД, оптимизация пайплайнов поиска и ранжирования).
Базовые знания Big Data-стэка (Spark) для обработки данных обучения.
Знание фреймворков глубокого обучения (например PyTorch) и библиотек (Transformers, Hugging Face).

условия

Что предлагаем

трудоустройство в соответствии с ТК РФ

Заработная плата обсуждается по результатам собеседования и зависит от профессионального уровня кандидата

Премии - по результатам работы

Медицинское страхование (ДМС)

Возможность профессионального развития и карьерного роста

Офис в Москве, но работа удаленно.

Рабочий день с 10 до 18 часов.

навыки

Стек и инструменты

ML NLP LLM RAG Python Kubernetes Docker PyTorch TensorRT ONNX gRPC REST API Prometheus Grafana ELK Spark

грейд

senior

формат

удалённо

зарплата

300 000 – 420 000 ₽

языки

English — Pre-Intermediate

рынок выше казахстанского IT-рынка на 82.1%

Эта вакансия

~ 2 437 200 ₸

Медиана рынка

1 338 146 ₸

152 вакансии Python

Открыть на hh.kz

Создать резюме

Узнайте Match Score и отслеживайте отклики

В избранное

компания

крупный производитель справочно-информационного ПО

Москва

Компания, расположенная в Москве, является крупным производителем справочно-информационного программного обеспечения, создающего решения для эффективн...

вакансия

4 мес. назад

на сайте

Все вакансии крупный производитель справочно-информационного ПО

Ваше соответствие

??%

Match Score

войдите и создайте резюме

Войти

Telegram WhatsApp

Подходит ли вам эта вакансия?

Зарегистрируйтесь и загрузите резюме — посчитаем % совпадения с этой вакансией, подсветим сильные стороны и что стоит подтянуть

Создать аккаунт PDF-парсинг резюме за 2 минуты

??%

Match Score

Похожие вакансии

6 вакансий

РГП Национальный центр геодезии и пространственной информации

12 ч. назад

IT-специалист (Python разработчик GIS/AI)

300 000 – 440 000 ₸

Ищем Python-разработчика для цифровой трансформации геодезии и картографии. Нужно создавать GIS-решения, автоматизировать обработку пространственных данных и внедрять AI. Предлагают гибкий график, удаленку и работу над масштабными проектами.

Python PostgreSQL PostGIS +22

middle удал. hh hh.kz

RDP

11 ч. назад

Embedded разработчик

~1 489 400 – 2 200 250 ₸ оценка

Ищем опытного Python-разработчика для работы над embedded-системами на Linux. Нужно разрабатывать сервисы удалённого управления, сопровождать ПО, участвовать в troubleshooting и развитии продукта. Предлагаем удалённую работу с редкими командировками в Москву, ДМС и обучение за счёт компании.

Python Linux Embedded +10

senior удал. hh hh.kz

Хекслет

11 ч. назад

Автор курса по LLM-разработке

~1 489 400 – 2 200 250 ₸ оценка

Создание практического курса по LLM-разработке от основ до продакшн-внедрения. Нужен автор с реальным опытом внедрения LLM-приложений, RAG и AI-агентов. Предлагается удалённая проектная работа.

LLM RAG AI-агенты +4

senior удал. hh hh.kz

АИМОР

1 д. назад

Backend Software Engineer

~1 489 400 – 2 200 250 ₸ оценка

Ищем опытного бэкенд-разработчика для создания и поддержки хостинг и VPN сервисов. Требуется 5+ лет опыта, отличное знание Python (Django/DRF) и Go, опыт с платежными системами и API. Предлагаем удаленную работу, полную занятость и конкурентную оплату.

Python Django DRF +10

senior удал. hh hh.kz

Bell Integrator

1 д. назад

Backend разработчик Python/Java

Разработка и поддержка микросервисных интеграционных систем для банковского сектора. Требуется опыт от 5 лет в Python или Java, знание архитектурных паттернов, контейнеризации и брокеров сообщений. Компания предлагает удаленную работу, карьерный рост и участие в масштабных проектах.

Python Java Backend +11

senior удал. hh hh.kz

АЙ-ТЕКО

1 д. назад

Python разработчик

~1 489 400 – 2 200 250 ₸ оценка

Ищем опытного Python-разработчика для создания сервисов на базе больших языковых моделей и AI-агентов. Требуется глубокий опыт в Python, AI/ML и работе с LLM. Компания предлагает стабильную занятость, соцпакет и возможности для профессионального роста.

Python LLM AI +18

senior удал. hh hh.kz

Источник Резюме + Match Score