8 1 д. назад

DevOps Engineer с опытом работы с ML-инфраструктурой

Вакансия для DevOps инженера, который будет работать на стыке DevOps и ML-инфраструктуры. Основные задачи включают поддержку LLM, настройку CI/CD и управление Kubernetes. Предлагается гибкий график, работа в команде экспертов и возможность развиваться в различных направлениях.

middle удалённо
Тип занятости
full-time
Опубликовано
19 января 2026
Языки
English: Pre-Intermediate
Вакансии в Telegram-канале
Свежие вакансии Каждый день
Подписаться

описание

Мы в поиске практикующего эксперта, готового работать на стыке DevOps и ML-инфраструктуры. Нам нужен человек с архитектурным мышлением, способный полностью вести инфраструктурные проекты — от идеи до результата.
1. Поддержка и развитие инфраструктуры LLM
Разворачивать и обновлять inference-сервисы (vLLM, TGI, Ollama) в кластере Deckhouse Kubernetes
Управлять GPU-нодами (2×H100): профили, квоты, allocation, DCGM-мониторинг.
Настраивать OpenWebUI (обновления, кастомные ассистенты, плагины, pipelines)
Настраивать CI/CD пайплайны для моделей и ассистентов (через GitLab CI/CD, Helm, ArgoCD).
Управлять хранилищами (PVC, MinIO/S3) для индексов и документов.
2. RAG
Настраивать пайплайны загрузки документов (Confluence, регламенты, файлы).
Оптимизировать параметры retrieval: chunk size, overlap, embedding-модели.
Настраивать интеграции с Langfuse (datasets, traces, evals) для оценки качества.
Разворачивать и обновлять LlamaIndex, Chroma, Postgres Vector — по мере масштабирования.
3. Интеграции и инструменты
Подключать новые MCP-инструменты (Jira, 1С, DWH, Контур-Фокус и др.) к ассистентам.
Разворачивать новые сервисные модули (например, Langfuse, LlamaIndex, Eval серверы).
Прокидывать порты, настраивать Ingress, Secrets, RBAC.
4. Наблюдаемость и качество
Настраивать мониторинг (Prometheus/Grafana, Langfuse)
Настраивать nightly evals (через Langfuse Datasets + judge-скоры).
5. Безопасность и контроль
Настраивать роли и лимиты в RBAC (OpenWebUI + Keycloak).
Реализовывать маскировку PII (телефоны, ИНН, e-mail) в пайплайнах.
Мы ищем человека, который:
Обладает системным мышлением, способный вести инфраструктурные проекты от концепции до промышленной эксплуатации;
Работает на стыке DevOps и ML-инфраструктуры, предпочитая задачи построения продуктовой LLM-платформы исследовательским экспериментам.
Что нужно от тебя:
Опыт работы с LLM-моделями (vLLM, TGI, Hugging Face, Ollama).
Практический опыт с Python (FastAPI, скрипты, CLI).
Понимание архитектуры RAG и работы с embedding-моделями.
Навыки настройки Prometheus/Grafana, анализа метрик производительности.
Опыт работы с системами аутентификации (Keycloak, JWT).
Уверенные знания Kubernetes, Docker, CI/CD (GitLab/Helm).
Понимание принципов RBAC, изоляции данных, PII-безопасности.
Будет плюсом:
Опыт работы с Deckhouse или другими K8s-дистрибутивами.
Знание Langfuse, LlamaIndex, Postgres Vector, Chroma.
Базовые знания MLOps (модели, fine-tuning, quantization, caching).
Опыт интеграции API внешних систем (Jira, 1С, DWH).
Умение писать внутренние утилиты и документацию.

условия

Работу в команде экспертов.
Широкий технологический стек, сотни проектов.
Гибкий график работы, который позволяет высыпаться и выделять время на хобби.
Льготы и меры господдержки, предусмотренные для IT-компаний (аккредитованы Минцифры*).
Возможность разрабатывать IT-решения для разных отраслей, пробовать новые технологии.
У нас выстроены процессы удаленной работы, при этом есть просторные офисы с зонами коворкинга, где можно с комфортом пообщаться, поиграть в настолки или в тишине обдумать рабочие задачи.
Возможность прокачаться во всех интересующих направлениях.
Развитую систему наставничества, сертификацию за счёт компании, участие в конференциях, изучение английского языка.
Активный обмен опытом, внутренние и внешние митапы по разработке, хакатоны, доклады по развитию hard и soft skills.
50+ клубов по интересам и профессиональных сообществ внутри компании.
Уютный мерч.
Полный соцпакет и «белую» зарплату.
Корпоративную базу знаний и социальную сеть для удобства общения с каждым из 1500+ сотрудников.
Гибкую систему бонусов, которая настраивается под индивидуальные потребности: различные уровни ДМС, оплата обучения и занятий любыми видами спорта.
Заботу о ментальном здоровье: онлайн-консультации с психологом.
Решение Министерства цифрового развития, связи и массовых коммуникаций РФ о предоставлении государственной аккредитации организации, осуществляющей деятельность в области информационных технологий от 10.03.2022 №АО-20220309-3771014210-3

Похожие вакансии

6 вакансии
Wildberries и Russ
Wildberries и Russ
19 ч. назад

Системный администратор

Присоединяйтесь к команде Wildberries и Russ в роли системного администратора. Вам потребуется опыт работы с Kafka, Clickhouse и…

middle удалённо
Динамично развивающаяся аккредитованная IT-компания
Динамично развивающаяся аккредитованная IT-компания
20 ч. назад

Системный администратор

Компания ищет системного администратора для работы с высоконагруженной инфраструктурой и автоматизацией процессов. Требуются уверенные навыки администрирования L…

middle удалённо
ГК МЕГАПОЛИС
ГК МЕГАПОЛИС
22 ч. назад

Инженер

Группа компаний ГК МЕГАПОЛИС ищет инженера для работы с Linux и PostgreSQL. Вам потребуется опыт администрирования и настройки серверов, а та…

middle удалённо
SimbirSoft
SimbirSoft
1 д. назад

DevOps/Database Engineer

SimbirSoft ищет DevOps/Database Engineer с опытом администрирования реляционных СУБД. Вы будете работать удаленно, участвуя в интересных прое…

middle удалённо
Т1
Т1
1 д. назад

SRE-инженер

Вакансия для SRE-инженера с опытом от 3 лет в администрировании Linux-систем и работе с Docker. Вы будете заниматься настройкой и эксплуа…

middle удалённо
GRI
GRI
1 д. назад

Системный администратор

В компании GRI открыта вакансия системного администратора. Вы будете заниматься развертыванием и поддержкой серверов на Linux, а так…

middle удалённо