40 2 мес. назад

Разработчик NLP/LLM

Ищем разработчика с опытом в NLP и LLM для работы над production-сервисами. Вам нужно будет проектировать и интегрировать решения, а также оптимизировать их производительность. Удаленная работа с официальным оформлением и возможностью обучения.

middle удалённо
Тип занятости
full-time
Опубликовано
15 декабря 2025
Языки
English: Pre-Intermediate
Вакансии в Telegram-канале
Свежие вакансии Каждый день
Подписаться
??%
Match Score
Войдите и создайте резюме
Войти

описание

Разработка production NLP/LLM-решений: поиск, классификация, извлечение, суммаризация, Q&A/ассистенты.
Проектирование агентских и неагентских LLM-пайплайнов: tool/function calling, маршрутизация, контракты инструментов, обработка ошибок, управление контекстом/состоянием.
Реализация knowledge Q&A / RAG: подготовка данных, индекс/поиск, эмбеддинги, reranking, grounding/цитирование, контроль качества.
Интеграция в корпоративную среду: сервисы и API, внутренние API/БД, очереди/воркеры, фоновые задачи.
Эксплуатация и улучшение: логи/метрики/трейсы, диагностика, регрессии качества/производительности.
Оптимизация инференса: latency/throughput, лимиты/контекст, кэширование/батчинг, квантование.
Опционально: адаптация под домен (PEFT/LoRA/QLoRA) с оценкой

требования

Образование: высшее техническое / ИТ.
Опыт: 3–5 лет разработки и поддержки production-сервисов в области NLP/LLM.
LLM в проде: понимание токенизации/контекста и ограничений, типовых failure-modes; понимание, когда уместна адаптация модели (PEFT/LoRA/QLoRA) и как оценивать влияние на качество/производительность.
RAG / knowledge Q&A: практический опыт построения решений на базе корпоративных данных: эмбеддинги, retrieval (векторный/гибридный), reranking, grounding/цитирование, контроль качества.
Инструменты LLM: HuggingFace + LangChain/LlamaIndex (или аналоги); опыт построения agentic/non-agentic пайплайнов с tool/function calling (контракты инструментов, устойчивость вызовов).
Backend и интеграции: сильный Python; сервисы и API (FastAPI или аналоги), очереди/воркеры/фоновые задачи, интеграции с внутренними системами; тесты и сопровождение.
Production/observability: логи/метрики/трейсы (Grafana/Prometheus или аналоги), диагностика инцидентов и деградаций качества/производительности.
Инфраструктура: Linux/CLI; Kubernetes на уровне чтения манифестов/логов и участия в диагностике.
Будет Плюсом:
Langfuse или аналоги (on-prem): трассировка/метрики/eval.
LiteLLM или аналоги: gateway/router, маршрутизация, лимиты.
OpenWebUI или аналоги: интеграция с retrieval/RAG и логированием.
Workflow orchestration: Temporal / Airflow / Prefect / Dagster / Argo; принципы идемпотентности, ретраев/таймаутов, зависимостей шагов, long-running процессов, сигналов/HITL, наблюдаемости выполнения.
MCP (Model Context Protocol): подключение инструментов по протоколу, контракт инструментов, безопасность/изоляция, наблюдаемость вызовов.
Self-hosted inference/serving: vLLM / TGI / Triton или аналоги; оптимизации GPU-инференса.

условия

Удалённый формат работы
Официальное оформление по ТкРФ, белая ЗП по результатам технического собеседования;
График работы 5/2 с 8:30 до 17:30 по Москве;
Премии за эффективную работу и достижение результатов;
Различные программы обучения для прокачки профессиональных скиллов;
ДМС программа

Похожие вакансии

6 вакансии
Ozon
Ozon
15 ч. назад

QA Engineer

Присоединяйтесь к команде Ozon в роли QA Engineer, где вы будете заниматься автоматизацией тестирования веб-сервисов. Ищем специалиста с опытом в Python и тестировании, который сможет работать в кроссфункциональной команде и развивать тестовые фреймворки.

QA · Automation · Python ·+3

middle удал.
АЙ-ТЕКО
АЙ-ТЕКО
21 ч. назад

Разработчик Python

Вам предстоит проектировать архитектуру модулей сбора и обработки данных, работать с ETL-процессами и интеграциями через REST API. Компания предлагает гибридный формат работы, белую заработную плату и ДМС с первого месяца.

middle удал.
gnivc
gnivc
1 д. назад

Разработчик REST API на FastAPI

Присоединяйтесь к команде gnivc, где вы будете разрабатывать облачную платформу и системы управления виртуализацией. Мы ищем специалиста с опытом работы с FastAPI и асинхронными библиотеками, который сможет реализовать высоконагруженные сетевые приложения и оптимизировать их производительность.

PostgreSQL · Python · Linux ·+8

middle удал.
SILVERME
SILVERME
1 д. назад

Аналитик e-commerce

Вакансия для аналитика e-commerce, который будет сочетать аналитику маркетплейсов с операционной поддержкой. Требуется опыт работы с Python и SQL, а также навыки в построении дашбордов. Официальное трудоустройство и возможность удаленной работы.

e-commerce · анализ данных · Python ·+13

middle удал.
Ozon
Ozon
1 д. назад

Инженер по автоматизации тестирования

Присоединяйтесь к команде Ozon и помогите развивать процессы QA в мобильной разработке. Вам потребуется опыт тестирования мобильных приложений и навыки программирования, желательно на Python. Мы предлагаем работу в стабильной команде с возможностью участия в релизах.

Python · Appium · Тестирование ·+6

middle удал.
GigaChat Alignment
GigaChat Alignment
1 д. назад

NLP Engineer

В этой роли вы будете заниматься разработкой и улучшением моделей GigaChat, включая тестирование новых подходов к обучению и создание пайплайнов валидации. Требуется опыт работы с LLM, знание Python и алгоритмов, а также уверенное владение Linux.

middle удал.