Инженер технической поддержки ML-платформы
Поддержка ML-платформы на Kubernetes для крупного российского банка. Нужен опыт работы с Kubernetes, мониторингом (Prometheus, Grafana) и скриптование (Python/Bash). Предлагают удаленную работу, официальное трудоустройство и ДМС.
Зарплата не указана — оценили по рынку
На основе 11 похожих вакансий за 90 дней.
Что предстоит делать
Навыки: Kubernetes, Prometheus, Grafana. Квалификация: Middle. Специализации: Инженер технической поддержки. ## ## О компании и команде Мы набираем IT специалистов в большую команду для работы на проектах для крупного и динамичного российского банка. Команда будет занимать разработкой инструментов и процессов для реализации единой платформы для разработки, развертывания и эксплуатации решений на основе LLM, а так же агентской платформы для работы с ИИ-агентами. Проект направлен на создание единой технологической платформы для разработки, развертывания и эксплуатации решений на основе больших языковых моделей с использованием инфраструктуры АС «Суперкомпьютер». Ключевая задача - переход от точечных пилотов к промышленному внедрению ИИ с централизацией управления безопасностью, качеством и стоимостью, а также настроить приоритизацию клиентских запросов. Архитектура платформы четырехуровневая: инфраструктурный слой (GPU-кластер), слой оркестрации и LLMOps, слой знаний (RAG), агентская платформа. ## Задачи Поддержка ML-платформы и Kubernetes (Основной фокус): • Эксплуатация платформы: o Мониторинг состояния сервисов инференса в Kubernetes (доступность подов, потребление ресурсов, перезапуски). o Диагностика проблем с запуском контейнеров моделей (ошибки инициализации, нехватка памяти, проблемы с зависимостями). • Мониторинг и инциденты: o Настройка дашбордов для отслеживания метрик качества сервисов; o Первичная реакция на инциденты: сбор логов, анализ трассировок, эскалация разработчикам (L3) при невозможности устранения в течение 15-30 минут; o Анализ причин деградации производительности моделей (дрейф данных, проблемы инфраструктуры); • Поддержка пользователей (Data Scientists / Разработчики): o Консультирование по использованию API платформы для деплоя и управления моделями; o Обучение работе с инструментами платформы (CLI, SDK, веб-интерфейс); o Создание инструкций и FAQ по типовым задачам развертывания; • Безопасность и доступы: o Управление доступом к функциям платформы согласно политикам безопасности; o Контроль соблюдения регламентов при работе с данными; Поддержка векторной БД Milvus (Опционально ): • Управление доступом: o Создание баз данных и ролей в Milvus и назначение прав; • Мониторинг Milvus: o Поддержка дашбордов Grafana для векторной БД (метрики: задержка поиска, загрузка CPU узлов query, использование диска, статус лидера etcd, отставание Kafka); o Реагирование на алерты (критические: остановка узлов, потеря лидера etcd, место на диске < 10%; предупреждения: задержка поиска > 5с, лаг Kafka > 1000). ## Ожидания от кандидата - Опыт использования Kubernetes (диагностика подов, работа с kubectl, понимание networking и storage); - Понимание принципов работы ML-моделей (инференс, API моделей, форматы данных); - Опыт настройки мониторинга и алертинга (Prometheus, Grafana, ELK); - Навыки скриптования (Python/Bash) для автоматизации рутинных задач; - Умение работать с пользователями и писать техническую документацию. ## Условия работы - Официальное трудоустройство по ТК РФ в аккредитованную IT компанию, белая заработная плата; - Удаленная формат работы; - ДМС после испытательного срока - И многое другое.
Стек и инструменты
Подходит ли вам эта вакансия?
Зарегистрируйтесь и загрузите резюме — посчитаем % совпадения с этой вакансией, подсветим сильные стороны и что стоит подтянуть
Похожие вакансии
6 вакансийDevOps Engineer
~2 044 110 – 3 237 066 ₸ оценка
Ищем DevOps-инженера для работы с облачной и bare-metal инфраструктурой, Kubernetes и автоматизацией. Требуется опыт с AWS, Terraform, Ansible. Работа удалённая, в международной iGaming-команде.
Инженер по виртуализации и автоматизации
~893 700 ₸ оценка
Облачный провайдер ищет инженера для развертывания и поддержки платформ виртуализации, автоматизации задач и администрирования инфраструктуры. Требуется уверенное знание Linux, опыт с Ansible, Zabbix, Grafana и одной из платформ виртуализации. Предлагают стабильный доход, ДМС и работу в заряженной команде.
Системный администратор / DevOps инженер
~893 700 ₸ оценка
Ищем системного администратора для поддержки серверов на Windows и AstraLinux, управления виртуализацией и мониторингом. Требуется опыт с AD, DNS, DHCP, Zabbix и Ansible. Предлагаем удаленную работу и полный день.
DevOps инженер
Ищем DevOps-инженера для развития инфраструктуры международного VPN-сервиса. Нужно поддерживать отказоустойчивую систему, автоматизировать процессы и обеспечивать безопасность. Предлагается работа в команде над масштабируемым проектом.
DevOps инженер
Поддержка и развитие инфраструктуры на bare-metal и AWS, управление Kubernetes, настройка мониторинга и автоматизация. Требуется опыт работы с сетями и базами данных, а также взаимодействие с разработчиками.
Инженер голосовой инфраструктуры (SIP/VoIP)
Вакансия для инженера по голосовой инфраструктуре. Требуется опыт работы с SIP/VoIP, Asterisk, FreeSWITCH, Kamailio, облачными платформами (GCP, AWS), Kubernetes и Terraform. Предлагается работа над высоконагруженной системой с фокусом на надежность и безопасность.