Перейти к содержимому
Yandex
Y
Yandex
Москва
активна · проверена 2 часа назад

Backend Developer (LLM Inference)

Разработка бэкенда для LLM-моделей (YandexGPT/Алиса) — инференс на GPU, оптимизация распределения вычислений, создание многокомпонентной системы. Требуется глубокое знание C++, многопоточности и опыт разработки крупных сервисов. Предлагается работа над сложными и разнообразными задачами в команде Яндекса.

senior удалённо ~1 324 000 – 2 151 500 ₸
Языки: English · Pre-Intermediate
salary intelligence

Зарплата не указана — оценили по рынку

На основе 8 похожих вакансий за 90 дней.

оценка p25–p75
1 324 000 – 2 151 500 ₸
медиана: 1 986 000 ₸
Хотите увидеть распределение по грейдам и городам? Зарплаты C++ Калькулятор зарплат
Вакансии в Telegram-канале
Свежие вакансии Каждый день
Подписаться
??%
Match Score
Войдите и создайте резюме
Войти
описание

Что предстоит делать

Наша команда разрабатывает и развивает бэкенды на основе LLM-моделей (под брендом YandexGPT/Алиса). Мы занимаемся непосредственно инференсом на GPU-ускорителях, а также огромным спектром вопросов, связанных с развитием и поддержкой продукта: API взаимодействия с фронтендом, реализацией ML-стека в рантайме, логами для аналитики и многим другим. Вместе с нами вы сможете поработать над сложными и разнообразными задачами. Какие задачи вас ждут Инференс тяжёлых языковых генеративных моделей на GPU-ускорителях Сердце LLM-based-продуктов — это, конечно, непосредственное вычисление LLM-моделей. Вас ждёт решение задач аллокации различных компонентов с LLM-моделями, настройка их взаимодействия, релизных процессов, подбор различных параметров для оптимизации. Оптимизация методов распределения работы между вычислительными узлами Можно оптимизировать не только само вычисление, но и методы разделения входящего потока между узлами, чтобы добиться наиболее выгодного по latency распределения работы между узлами. Также мы экспериментируем с отложенным продолжением вычислений. Разработка различных кусков многокомпонентной системы Ответ на основе поисковых источников — сложный многокомпонентный продукт. Важно не только вычислить что-то с помощью LLM-модели, но и: 1) приносить данные на вход модели; 2) правильно сохранять результаты для отдачи их пользователям; 3) настраивать взаимодействие с фронтендом (стриминг, например); 4) обеспечивать продуктовым и ML-командам возможность проводить эксперименты и улучшать продукт. Всё вместе порождает немало содержательных и сложных задач. Работа в бэкенде поисковых LLM открывает много технических вызовов, менее привычных в продуктах, которые не работают с LLM-моделями. Ведь вычисления, длящиеся не сотни миллисекунд, а многие секунды, требуют пересмотра устоявшихся подходов. Мы ждем, что вы • Разбираетесь в базовых алгоритмах и структурах данных • Хорошо знаете С++ • Знакомы с паттернами и идиомами построения программного обеспечения • Умеете писать надёжный и читабельный многопоточный код • Разрабатывали большой сервис в команде

навыки

Стек и инструменты

Подходит ли вам эта вакансия?

Зарегистрируйтесь и загрузите резюме — посчитаем % совпадения с этой вакансией, подсветим сильные стороны и что стоит подтянуть

Создать аккаунт PDF-парсинг резюме за 2 минуты

Ещё в Яндекс

26 активных вакансий в компании

15 ч. назад

Backend-разработчик LLM (C++)

Разработка бэкенда для LLM-моделей (YandexGPT/Алиса) на C++. Задачи включают инференс на GPU, оптимизацию распределения вычислений и создание многокомпонентной системы. Требуется глубокое знание C++, многопоточности и опыт разработки крупных сервисов. Предлагается гибридный формат в Минске.

C++ LLM GPU +5
senior удал. hh
6 д. назад

Наставник по Android-разработке

~1 820 500 – 3 143 988 ₸ оценка

Яндекс Практикум ищет опытного Android-разработчика для роли наставника. Нужно помогать студентам с вопросами, проводить вебинары и улучшать курс. Требуется от 3 лет опыта и умение понятно объяснять. Работа удаленная, частичная занятость.

Android Kotlin Compose +4
senior удал. hh
1 нед. назад

Наставник в Яндекс Практикум (Full-stack разработчик)

~1 456 400 – 2 151 500 ₸ оценка

Яндекс Практикум ищет наставника для студентов курса по full-stack разработке. Нужно помогать с вопросами, проводить вебинары и давать обратную связь. Требуется коммерческий опыт с Next.js, TypeScript, React, AI-инструментами и деплоем на VPS. Работа удаленная, 2-3 часа в день, с возможностью совмещения с основной работой.

Next.js TypeScript React +12
senior удал. hh
1 нед. назад

Backend-разработчик (C++) в сервис недвижимости Поиска Яндекса

Яндекс ищет опытного бэкенд-разработчика для создания сервиса недвижимости внутри Поиска. Нужно разрабатывать высоконагруженные компоненты, проектировать масштабируемую архитектуру и интегрировать ML-модели. Ключевое требование — отличное владение C++ или готовность на него перейти.

C++ STL микросервисы +6
senior удал. hh

Похожие вакансии

6 вакансий
Аквариус, Группа компаний
А
Аквариус, Группа компаний
14 ч. назад

C++ разработчик

~1 324 000 – 2 151 500 ₸ оценка

Разработка высоконагруженных отказоустойчивых сервисов на C++ для облачной инфраструктуры. Требуется глубокое знание C++17, многопоточности, сетевых протоколов и работы с распределёнными системами. Компания предлагает полную удалёнку, ДМС и возможности профессионального роста.

C++ C++17 многопоточность +25
senior удал. hh
Яндекс
Я
Яндекс
15 ч. назад

Backend-разработчик LLM (C++)

Разработка бэкенда для LLM-моделей (YandexGPT/Алиса) на C++. Задачи включают инференс на GPU, оптимизацию распределения вычислений и создание многокомпонентной системы. Требуется глубокое знание C++, многопоточности и опыт разработки крупных сервисов. Предлагается гибридный формат в Минске.

C++ LLM GPU +5
senior удал. hh
БЮРО 1440
Б
БЮРО 1440
16 ч. назад

C++ разработчик систем управления космическими аппаратами

~1 324 000 – 2 151 500 ₸ оценка

Разработка и тестирование систем управления для космических аппаратов на C++20. Требуется глубокое знание C++, Linux, Docker и сетевых протоколов. Предлагается удаленная или гибридная работа, современный офис в Москве и зарплата на уровне лидеров IT-индустрии.

C++20 STL Docker +19
senior удал. hh
SoftServe
S
SoftServe
1 д. назад

Старший инженер по робототехнике, ИИ и симуляции

~2 345 700 – 3 351 000 ₸ (17 500 – 25 000 PLN)

Компания SoftServe ищет старшего инженера для работы над робототехникой, ИИ и симуляцией. Требуется знание C и C++, а также высшее образование. Предлагается удаленная работа.

C C++ Degree +3
senior удал. nfj
SoftServe
S
SoftServe
1 д. назад

Старший инженер по робототехнике, ИИ и симуляции

~2 345 700 – 3 351 000 ₸ (17 500 – 25 000 PLN)

SoftServe ищет старшего инженера для работы над робототехникой, ИИ и симуляцией. Требуется знание C и C++, а также высшее образование. Предлагается удаленная работа.

C C++ Degree +3
senior удал. nfj
SoftServe
S
SoftServe
1 д. назад

Старший инженер по робототехнике, ИИ и симуляции

~2 345 700 – 3 351 000 ₸ (17 500 – 25 000 PLN)

Ищем старшего инженера для работы над робототехникой, ИИ и симуляцией. Требуется знание C и C++, а также высшее образование. Предлагается удаленная работа.

C C++ Degree
senior удал. nfj