Backend-разработчик LLM (C++)
Разработка бэкенда для LLM-моделей (YandexGPT/Алиса) на C++. Задачи включают инференс на GPU, оптимизацию распределения вычислений и создание многокомпонентной системы. Требуется глубокое знание C++, многопоточности и опыт разработки крупных сервисов. Предлагается гибридный формат в Минске.
Что предстоит делать
Наша команда разрабатывает и развивает бэкенды на основе LLM-моделей (под брендом YandexGPT/Алиса). Мы занимаемся непосредственно инференсом на GPU-ускорителях, а также огромным спектром вопросов, связанных с развитием и поддержкой продукта: API взаимодействия с фронтендом, реализацией ML-стека в рантайме, логами для аналитики и многим другим. Вместе с нами вы сможете поработать над сложными и разнообразными задачами. Какие задачи вас ждут Инференс тяжёлых языковых генеративных моделей на GPU-ускорителях Сердце LLM-based-продуктов — это, конечно, непосредственное вычисление LLM-моделей. Вас ждёт решение задач аллокации различных компонентов с LLM-моделями, настройка их взаимодействия, релизных процессов, подбор различных параметров для оптимизации. Оптимизация методов распределения работы между вычислительными узлами Можно оптимизировать не только само вычисление, но и методы разделения входящего потока между узлами, чтобы добиться наиболее выгодного по latency распределения работы между узлами. Также мы экспериментируем с отложенным продолжением вычислений. Разработка различных кусков многокомпонентной системы Ответ на основе поисковых источников — сложный многокомпонентный продукт. Важно не только вычислить что-то с помощью LLM-модели, но и: 1) приносить данные на вход модели; 2) правильно сохранять результаты для отдачи их пользователям; 3) настраивать взаимодействие с фронтендом (стриминг, например); 4) обеспечивать продуктовым и ML-командам возможность проводить эксперименты и улучшать продукт. Всё вместе порождает немало содержательных и сложных задач. Работа в бэкенде поисковых LLM открывает много технических вызовов, менее привычных в продуктах, которые не работают с LLM-моделями. Ведь вычисления, длящиеся не сотни миллисекунд, а многие секунды, требуют пересмотра устоявшихся подходов. Мы ждем, что вы • Разбираетесь в базовых алгоритмах и структурах данных • Хорошо знаете С++ • Знакомы с паттернами и идиомами построения программного обеспечения • Умеете писать надёжный и читабельный многопоточный код • Разрабатывали большой сервис в команде Оформление по ТК РБ, гибридный формат работы из офиса в Минске.
Стек и инструменты
Подходит ли вам эта вакансия?
Зарегистрируйтесь и загрузите резюме — посчитаем % совпадения с этой вакансией, подсветим сильные стороны и что стоит подтянуть
Ещё в Яндекс
26 активных вакансий в компании
Backend Developer (LLM Inference)
~1 324 000 – 2 151 500 ₸ оценка
Разработка бэкенда для LLM-моделей (YandexGPT/Алиса) — инференс на GPU, оптимизация распределения вычислений, создание многокомпонентной системы. Требуется глубокое знание C++, многопоточности и опыт разработки крупных сервисов. Предлагается работа над сложными и разнообразными задачами в команде Яндекса.
Наставник по Android-разработке
~1 820 500 – 3 143 988 ₸ оценка
Яндекс Практикум ищет опытного Android-разработчика для роли наставника. Нужно помогать студентам с вопросами, проводить вебинары и улучшать курс. Требуется от 3 лет опыта и умение понятно объяснять. Работа удаленная, частичная занятость.
Наставник в Яндекс Практикум (Full-stack разработчик)
~1 456 400 – 2 151 500 ₸ оценка
Яндекс Практикум ищет наставника для студентов курса по full-stack разработке. Нужно помогать с вопросами, проводить вебинары и давать обратную связь. Требуется коммерческий опыт с Next.js, TypeScript, React, AI-инструментами и деплоем на VPS. Работа удаленная, 2-3 часа в день, с возможностью совмещения с основной работой.
Backend-разработчик (C++) в сервис недвижимости Поиска Яндекса
Яндекс ищет опытного бэкенд-разработчика для создания сервиса недвижимости внутри Поиска. Нужно разрабатывать высоконагруженные компоненты, проектировать масштабируемую архитектуру и интегрировать ML-модели. Ключевое требование — отличное владение C++ или готовность на него перейти.
Похожие вакансии
6 вакансий
C++ разработчик
~1 324 000 – 2 151 500 ₸ оценка
Разработка высоконагруженных отказоустойчивых сервисов на C++ для облачной инфраструктуры. Требуется глубокое знание C++17, многопоточности, сетевых протоколов и работы с распределёнными системами. Компания предлагает полную удалёнку, ДМС и возможности профессионального роста.
Backend Developer (LLM Inference)
~1 324 000 – 2 151 500 ₸ оценка
Разработка бэкенда для LLM-моделей (YandexGPT/Алиса) — инференс на GPU, оптимизация распределения вычислений, создание многокомпонентной системы. Требуется глубокое знание C++, многопоточности и опыт разработки крупных сервисов. Предлагается работа над сложными и разнообразными задачами в команде Яндекса.
C++ разработчик систем управления космическими аппаратами
~1 324 000 – 2 151 500 ₸ оценка
Разработка и тестирование систем управления для космических аппаратов на C++20. Требуется глубокое знание C++, Linux, Docker и сетевых протоколов. Предлагается удаленная или гибридная работа, современный офис в Москве и зарплата на уровне лидеров IT-индустрии.
Старший инженер по робототехнике, ИИ и симуляции
Компания SoftServe ищет старшего инженера для работы над робототехникой, ИИ и симуляцией. Требуется знание C и C++, а также высшее образование. Предлагается удаленная работа.
Старший инженер по робототехнике, ИИ и симуляции
SoftServe ищет старшего инженера для работы над робототехникой, ИИ и симуляцией. Требуется знание C и C++, а также высшее образование. Предлагается удаленная работа.
Старший инженер по робототехнике, ИИ и симуляции
Ищем старшего инженера для работы над робототехникой, ИИ и симуляцией. Требуется знание C и C++, а также высшее образование. Предлагается удаленная работа.