Lead GPU Engineer (CUDA/Triton) for LLM
Создаём сильные языковые модели, включая GigaChat3 Ultra. Ищем лида для разработки и оптимизации CUDA/Triton-ядер для LLM. Требуется глубокий опыт GPU-программирования и управления командой. Предлагаем удалённую работу, годовую премию и широкий соцпакет.
Зарплата не указана — оценили по рынку
На основе 68 похожих вакансий за 90 дней.
Что предстоит делать
О проекте Мы создаём самые сильные языковые модели в России и одни из самых больших в мире такие как GigaChat3 Ultra. Создание таких систем требует оптимизации архитектуры под GPU и решение проблем с масштабированием на кластера из тысяч видеокарт. Все это - нетривиальные инженерные вызовы, решение которых закладывается в следующие поколения наших моделей. У нас вы будете работать с современным набором видеокарт: NVIDIA B200/H100. Наш стек полностью интегрирован с PyTorch/TensorRT/ONNX и активно использует Triton, CUDA, CUTLASS и кастомные ядра для оптимизации: FlashAttention, PagedAttention, DeepEP, и др. Среди наших достижений — реализация собственных ядер для распределённого обучения: асинхронный Expert & Tensor Parallel, а также Async Liger. Но хочется больше Цель - снизить latency и увеличить throughput, оптимизировать новые архитектуры, делать их обучение экономически выгодным по сравнению с классическими LLM & MoE Ключевые обязанности • Лидировать направление по разработке и оптимизации CUDA/Triton-ядер для LLM • Тесно взаимодействовать с ML-инженерами и research-командами для понимания workload’ов и bottleneck’ов (например: multinode inference, sparse attention, mixture-of-experts, long-context inference). • Участвовать в open-source инициативах (возможно — форки/патчи в Triton, upstream в PyTorch/TensorRT/SGLang). Мы ожидаем, что вы • Имеете 5+ лет опыта в low-level GPU программировании (CUDA C++, PTX/SASS, shared memory/coalescing/warp-shuffle, async memcpy, stream management). • Глубоко понимаете архитектуру NVIDIA GPU (Tensor Cores, warp execution, occupancy, L2 cache hierarchy) и умеете профилировать через Nsight. • Владеете Triton (или готовы освоить быстро) и понимаете его trade-offs vs чистая CUDA. • Есть опыт работы с современными фреймворками: PyTorch (custom ops, torch.compile), TensorRT (plugins), возможно — SGLang. • Имеете опыт управления технической командой (2+ лет как lead/tech lead)
Что предлагаем
Стек и инструменты
Подходит ли вам эта вакансия?
Зарегистрируйтесь и загрузите резюме — посчитаем % совпадения с этой вакансией, подсветим сильные стороны и что стоит подтянуть
Ещё в Сбер
28 активных вакансий в компании
Разработчик Java/Kotlin
Ищем разработчика для создания и поддержки веб-приложений на Spring Boot с Java/Kotlin. Требуется опыт с JPA, Hibernate, SQL, Docker и Kubernetes. Предлагаем работу над современными сервисами.
ML Engineer
Ищем ML Engineer для работы с мультимодальными данными. Нужно готовить датасеты, строить и поддерживать data pipeline, контролировать качество данных и разметки, анализировать метрики. Требуется уверенный Python и опыт в ML.
Специалист по DevOps
~1 392 300 – 2 088 450 ₸ оценка
Ищем DevOps-специалиста для автоматизации развертывания и администрирования систем. Требуется опыт работы с Kubernetes, Openshift, Ansible и Jenkins. Предстоит управлять конфигурациями, мониторингом и инцидентами, а также взаимодействовать с командами разработки.
Похожие вакансии
6 вакансийВедущий Python разработчик (Кибербезопасность)
Ищем ведущего Python-разработчика с опытом в кибербезопасности для стартапа, занимающегося аналитикой данных и расследованиями. Нужно писать код, проектировать архитектуру, управлять задачами и внедрять безопасность в процессы. Предлагают удаленную работу из Киева, медстраховку и уроки английского.
Ведущий Back-End разработчик (Python, AI)
Ведущий back-end разработчик для создания масштабируемой инфраструктуры AI-платформы, работающей с графами знаний и продвинутыми агентами. Требуется 7+ лет опыта, глубокое знание Python и Kubernetes, свободный английский. Предлагается удаленная работа, конкурентная оплата и работа с передовыми технологиями.
Backend разработчик (Python, AI-продукт)
Ищем опытного разработчика для работы в международном AI-стартапе. Нужно писать бэкенд на Python, иногда заниматься фронтендом, проектировать микросервисы и управлять командой. Предлагаем полную удалёнку и работу с современными технологиями.
Старший Python инженер
Старший Python инженер для разработки AI-голосовой платформы на AWS. Требуется 5+ лет опыта, сильный Python, микросервисы, Docker и CI/CD. Предлагают удаленную работу, конкурентоспособную оплату и возможности роста.
Python Developer
COAX Software шукає досвідченого Python-розробника для створення бекенд-компонентів для міжнародних проєктів. Потрібен досвід від 4 років з Python, Django, FastAPI та Docker. Компанія пропонує гнучкий графік, сучасну техніку та професійний розвиток.
Senior Backend-разработчик (Python)
~1 458 600 – 2 154 750 ₸ оценка
Ищем senior backend-разработчика на Python для создания и развития высоконагруженных микросервисов в финтех-компании. Нужен опыт от 4 лет, глубокое знание асинхронности, FastAPI, брокеров сообщений и архитектурных паттернов. Предлагаем полную удаленку, гибкую оплату и дружную команду.