Перейти к содержимому
Сбер
С
Сбер
Москва

Lead GPU Engineer (CUDA/Triton) for LLM

Создаём сильные языковые модели, включая GigaChat3 Ultra. Ищем лида для разработки и оптимизации CUDA/Triton-ядер для LLM. Требуется глубокий опыт GPU-программирования и управления командой. Предлагаем удалённую работу, годовую премию и широкий соцпакет.

lead удалённо ~1 379 040 ₸
Вакансия опубликована 187 дней назад. Может быть уже неактуальна — рекомендуем уточнить статус у работодателя перед откликом.
Языки: English · Pre-Intermediate
salary intelligence

Зарплата не указана — оценили по рынку

На основе 68 похожих вакансий за 90 дней.

оценка p25–p75
663 000 – 1 657 500 ₸
медиана: 1 379 040 ₸
Хотите увидеть распределение по грейдам и городам? Зарплаты Python Калькулятор зарплат
Вакансии в Telegram-канале
Свежие вакансии Каждый день
Подписаться
??%
Match Score
Войдите и создайте резюме
Войти
описание

Что предстоит делать

О проекте Мы создаём самые сильные языковые модели в России и одни из самых больших в мире такие как GigaChat3 Ultra. Создание таких систем требует оптимизации архитектуры под GPU и решение проблем с масштабированием на кластера из тысяч видеокарт. Все это - нетривиальные инженерные вызовы, решение которых закладывается в следующие поколения наших моделей. У нас вы будете работать с современным набором видеокарт: NVIDIA B200/H100. Наш стек полностью интегрирован с PyTorch/TensorRT/ONNX и активно использует Triton, CUDA, CUTLASS и кастомные ядра для оптимизации: FlashAttention, PagedAttention, DeepEP, и др. Среди наших достижений — реализация собственных ядер для распределённого обучения: асинхронный Expert & Tensor Parallel, а также Async Liger. Но хочется больше Цель - снизить latency и увеличить throughput, оптимизировать новые архитектуры, делать их обучение экономически выгодным по сравнению с классическими LLM & MoE Ключевые обязанности • Лидировать направление по разработке и оптимизации CUDA/Triton-ядер для LLM • Тесно взаимодействовать с ML-инженерами и research-командами для понимания workload’ов и bottleneck’ов (например: multinode inference, sparse attention, mixture-of-experts, long-context inference). • Участвовать в open-source инициативах (возможно — форки/патчи в Triton, upstream в PyTorch/TensorRT/SGLang). Мы ожидаем, что вы • Имеете 5+ лет опыта в low-level GPU программировании (CUDA C++, PTX/SASS, shared memory/coalescing/warp-shuffle, async memcpy, stream management). • Глубоко понимаете архитектуру NVIDIA GPU (Tensor Cores, warp execution, occupancy, L2 cache hierarchy) и умеете профилировать через Nsight. • Владеете Triton (или готовы освоить быстро) и понимаете его trade-offs vs чистая CUDA. • Есть опыт работы с современными фреймворками: PyTorch (custom ops, torch.compile), TensorRT (plugins), возможно — SGLang. • Имеете опыт управления технической командой (2+ лет как lead/tech lead)

условия

Что предлагаем

Формат работы - удиленный или гибрид на выбор из любого города РФ
Ежегодный пересмотр зарплаты годовая премия
Зоны отдыха
Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
Программа адаптации и помощь руководителя на старте (для стартовых позиций)
Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
Ипотека для сотрудников выгоднее до 7%
Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
Вознаграждение за рекомендацию друзей в команду Сбера
навыки

Стек и инструменты

Подходит ли вам эта вакансия?

Зарегистрируйтесь и загрузите резюме — посчитаем % совпадения с этой вакансией, подсветим сильные стороны и что стоит подтянуть

Создать аккаунт PDF-парсинг резюме за 2 минуты

Ещё в Сбер

28 активных вакансий в компании

1 д. назад

Разработчик Java/Kotlin

Ищем разработчика для создания и поддержки веб-приложений на Spring Boot с Java/Kotlin. Требуется опыт с JPA, Hibernate, SQL, Docker и Kubernetes. Предлагаем работу над современными сервисами.

Spring Boot Java Kotlin +5
middle Russia HR cr
1 д. назад

ML Engineer

Ищем ML Engineer для работы с мультимодальными данными. Нужно готовить датасеты, строить и поддерживать data pipeline, контролировать качество данных и разметки, анализировать метрики. Требуется уверенный Python и опыт в ML.

ML Engineer мультимодальные данные датасеты +6
junior Russia HR cr
2 д. назад

Специалист по DevOps

~1 392 300 – 2 088 450 ₸ оценка

Ищем DevOps-специалиста для автоматизации развертывания и администрирования систем. Требуется опыт работы с Kubernetes, Openshift, Ansible и Jenkins. Предстоит управлять конфигурациями, мониторингом и инцидентами, а также взаимодействовать с командами разработки.

DevOps Kubernetes Openshift +4
junior Russia HR cr
2 д. назад

Java разработчик (Team Lead)

Разработка и поддержка системы автоматизации корпоративного транспорта на Java Spring Boot. Требуется опыт в Java и управлении командой. Работа в Сбере.

Java Spring Boot микросервисы +1
lead Russia HR cr

Похожие вакансии

6 вакансий
C
CORE Team
2 д. назад

Ведущий Python разработчик (Кибербезопасность)

Ищем ведущего Python-разработчика с опытом в кибербезопасности для стартапа, занимающегося аналитикой данных и расследованиями. Нужно писать код, проектировать архитектуру, управлять задачами и внедрять безопасность в процессы. Предлагают удаленную работу из Киева, медстраховку и уроки английского.

Python Кибербезопасность Agile +3
lead удал. dou
T
Truelogic AI LTD
2 д. назад

Ведущий Back-End разработчик (Python, AI)

от ~2 438 650 ₸ (5 000 USD)

Ведущий back-end разработчик для создания масштабируемой инфраструктуры AI-платформы, работающей с графами знаний и продвинутыми агентами. Требуется 7+ лет опыта, глубокое знание Python и Kubernetes, свободный английский. Предлагается удаленная работа, конкурентная оплата и работа с передовыми технологиями.

Python Kubernetes AI +5
lead удал. dou
C
Компания
2 д. назад

Backend разработчик (Python, AI-продукт)

~2 438 650 – 2 438 650 ₸ (5 000 – 5 000 USD)

Ищем опытного разработчика для работы в международном AI-стартапе. Нужно писать бэкенд на Python, иногда заниматься фронтендом, проектировать микросервисы и управлять командой. Предлагаем полную удалёнку и работу с современными технологиями.

Python React Vue +4
lead удал. HR cr
M
Miratech
23 ч. назад

Старший Python инженер

Старший Python инженер для разработки AI-голосовой платформы на AWS. Требуется 5+ лет опыта, сильный Python, микросервисы, Docker и CI/CD. Предлагают удаленную работу, конкурентоспособную оплату и возможности роста.

Python AWS microservices +7
senior удал. dou
C
COAX Software
1 д. назад

Python Developer

COAX Software шукає досвідченого Python-розробника для створення бекенд-компонентів для міжнародних проєктів. Потрібен досвід від 4 років з Python, Django, FastAPI та Docker. Компанія пропонує гнучкий графік, сучасну техніку та професійний розвиток.

Python Django FastAPI +9
senior удал. dou
МКК «Небус»
М
МКК «Небус»
1 д. назад

Senior Backend-разработчик (Python)

~1 458 600 – 2 154 750 ₸ оценка

Ищем senior backend-разработчика на Python для создания и развития высоконагруженных микросервисов в финтех-компании. Нужен опыт от 4 лет, глубокое знание асинхронности, FastAPI, брокеров сообщений и архитектурных паттернов. Предлагаем полную удаленку, гибкую оплату и дружную команду.

Python FastAPI SQLAlchemy +12
senior удал. hh