Backend Developer (LLM Inference)
Разработка и оптимизация бэкенда для LLM-моделей (YandexGPT/Алиса) на C++. Задачи включают инференс на GPU, распределение нагрузки между узлами и создание многокомпонентной системы. Требуется глубокое знание C++, многопоточности и опыт разработки крупных сервисов.
Зарплата не указана — оценили по рынку
На основе 7 похожих вакансий за 90 дней.
Что предстоит делать
Наша команда разрабатывает и развивает бэкенды на основе LLM-моделей (под брендом YandexGPT/Алиса). Мы занимаемся непосредственно инференсом на GPU-ускорителях, а также огромным спектром вопросов, связанных с развитием и поддержкой продукта: API взаимодействия с фронтендом, реализацией ML-стека в рантайме, логами для аналитики и многим другим. Вместе с нами вы сможете поработать над сложными и разнообразными задачами. Какие задачи вас ждут Инференс тяжёлых языковых генеративных моделей на GPU-ускорителях Сердце LLM-based-продуктов — это, конечно, непосредственное вычисление LLM-моделей. Вас ждёт решение задач аллокации различных компонентов с LLM-моделями, настройка их взаимодействия, релизных процессов, подбор различных параметров для оптимизации. Оптимизация методов распределения работы между вычислительными узлами Можно оптимизировать не только само вычисление, но и методы разделения входящего потока между узлами, чтобы добиться наиболее выгодного по latency распределения работы между узлами. Также мы экспериментируем с отложенным продолжением вычислений. Разработка различных кусков многокомпонентной системы Ответ на основе поисковых источников — сложный многокомпонентный продукт. Важно не только вычислить что-то с помощью LLM-модели, но и: 1) приносить данные на вход модели; 2) правильно сохранять результаты для отдачи их пользователям; 3) настраивать взаимодействие с фронтендом (стриминг, например); 4) обеспечивать продуктовым и ML-командам возможность проводить эксперименты и улучшать продукт. Всё вместе порождает немало содержательных и сложных задач. Работа в бэкенде поисковых LLM открывает много технических вызовов, менее привычных в продуктах, которые не работают с LLM-моделями. Ведь вычисления, длящиеся не сотни миллисекунд, а многие секунды, требуют пересмотра устоявшихся подходов. Мы ждем, что вы • Разбираетесь в базовых алгоритмах и структурах данных • Хорошо знаете С++ • Знакомы с паттернами и идиомами построения программного обеспечения • Умеете писать надёжный и читабельный многопоточный код • Разрабатывали большой сервис в команде
Стек и инструменты
Подходит ли вам эта вакансия?
Зарегистрируйтесь и загрузите резюме — посчитаем % совпадения с этой вакансией, подсветим сильные стороны и что стоит подтянуть
Ещё в Яндекс
27 активных вакансий в компании
Наставник по Android-разработке
~1 790 100 ₸ оценка
Яндекс Практикум ищет опытного Android-разработчика для роли наставника. Нужно помогать студентам с вопросами, проводить вебинары и улучшать курс. Требуется от 3 лет опыта и умение понятно объяснять. Работа удаленная, частичная занятость.
Наставник в Яндекс Практикум (Full-stack разработчик)
~1 657 500 – 2 154 750 ₸ оценка
Яндекс Практикум ищет наставника для студентов курса по full-stack разработке. Нужно помогать с вопросами, проводить вебинары и давать обратную связь. Требуется коммерческий опыт с Next.js, TypeScript, React, AI-инструментами и деплоем на VPS. Работа удаленная, 2-3 часа в день, с возможностью совмещения с основной работой.
Backend-разработчик (C++) в сервис недвижимости Поиска Яндекса
~1 326 000 ₸ оценка
Яндекс ищет опытного бэкенд-разработчика для создания сервиса недвижимости внутри Поиска. Нужно разрабатывать высоконагруженные компоненты, проектировать масштабируемую архитектуру и интегрировать ML-модели. Ключевое требование — отличное владение C++ или готовность на него перейти.
Backend-разработчик (C++) в сервис недвижимости Поиска Яндекса
Яндекс ищет опытного бэкенд-разработчика для создания сервиса недвижимости внутри Поиска. Нужно разрабатывать высоконагруженные компоненты, проектировать масштабируемую архитектуру и интегрировать ML-модели. Ключевое требование — отличное владение C++ или готовность на него перейти.
Похожие вакансии
6 вакансий
Разработчик C++ со знанием Delphi
~1 326 000 ₸ оценка
Разработка и поддержка ПО для борьбы с преступностью. Требуется опыт C++ и Delphi уровня Senior. Предлагают удаленную работу, ДМС, обучение и допвыходной.
Senior C++ Developer
~3 027 082 – 3 829 610 ₸ оценка
Вакансия для разработчика системного ПО на C/C++: создание сетевых демонов и служб под Linux, работа с сетевыми протоколами и оборудованием. Требуется опыт программирования на C/C++ и знание сетевых технологий.
Инженер-разработчик OpenBMC
~1 326 000 ₸ оценка
Ищем опытного C++ разработчика для работы над OpenBMC — open-source проектом для управления серверами. Нужно знание Linux, Yocto, Python и низкоуровневых протоколов. Предлагаем удалёнку, гибкий график, ДМС и возможности роста.
C/C++ разработчик DPI (Deep Packet Inspection)
~1 326 000 ₸ оценка
Команда ищет C/C++ разработчика для создания высокопроизводительного модуля анализа трафика (DPI) для Secure SD-WAN. Нужен опыт работы с DPDK, сетевыми протоколами и многопоточностью. Компания предлагает гибкий график, ДМС, обучение и дружную атмосферу.
Старший инженер-программист (C++, Qt)
Ищем старшего разработчика для работы с C++, Qt и QML. Требуется опыт в создании интерфейсов и знание Vue.js. Компания предлагает удаленный формат работы.
Старший инженер-программист (C++, Qt)
Ищем старшего разработчика для работы с C++, Qt и QML. Требуется опыт работы с Vue.js. Предлагается удаленная занятость в международной компании.