6 сегодня

Разработчик AI-сервисов

В этой роли вы будете заниматься разработкой мультиагентных RAG-систем и интеграцией LLM в корпоративные приложения. Требуется опыт работы с Hugging Face Transformers и знание Python на уровне middle. Предлагается работа в команде с возможностью карьерного роста.

middle удалённо
Опубликовано
18 февраля 2026
Языки
English: Pre-Intermediate
Вакансии в Telegram-канале
Свежие вакансии Каждый день
Подписаться
??%
Match Score
Войдите и создайте резюме
Войти

описание

Ищем разработчика middle-уровня для работы над внутренними AI-сервисами компании с фокусом на текстовые модели и RAG-системы. Основная задача — разработка и интеграция интеллектуальных чат-ботов для консультации пользователей, систем поддержки продаж, аналитики на основе больших текстовых данных. Основные проекты: - Разработка мультиагентной RAG-систем для ботов поддержки сотрудников - Интеграция LLM в корпоративные приложения - Создание систем аналитики на больших текстовых датасетах Особенности позиции: - Интеграция моделей, выбранных data scientists, в готовые продукты - Критически важны умение оптимизировать быстродействие и стоимость при сохранении уровня качества решений - Работа с большими текстовыми датасетами и векторными базами данных - Работа как с внешними провайдерами LLM, так и с внутренними сервисами.
Текстовые модели и RAG-системы (основной фокус)
Разработка мультиагентных RAG-систем для ответов на вопросы пользователей и сотрудников
Интеграция LLM в чат-боты и корпоративные приложения
Prompt engineering и оптимизация запросов к LLM API (батчинг, кэширование, параллезация запросов)
Работа с моделями эмбеддеров, использование LLM как реранкеров
Работа с векторными базами данных (Qdrant, Chroma)
Работа с графовыми базами знаний (GraphRAG + Neo4j)
Создание pipeline для аналитики на больших текстовых датасетах
Обработка текста: токенизация, нормализация, очистка, работа с большими объемами данных
Оценка качества решений: настройка метрик релевантности и точности ответов
Интеграция и развертывание:
Создание API endpoints (FastAPI, Flask) для развертывания ML-моделей
Разработка собственных workflow агентных систем для интеграции моделей в продукты
Оптимизация пайплайна обработки данных с учетом быстродействия и стоимости
Настройка мониторинга производительности и качества моделей в продакшене
Работа с арендованными GPU-серверами для развертывания моделей
Асинхронное программирование для обработки больших объемов параллельных запросов
Бонусные направления (желательно, но не обязательно):
Компьютерное зрение: интеграция моделей детекции объектов, работа с Vision-Language Models (VLM), около-реалтайм обработка видео-потоков
Обработка речи: батчевая обработка аудио-записей, разработка голосовых интерфейсов (TTS+STT), анализ качества звонков

требования

Обязательные навыки
Текстовые модели и RAG (основной фокус):
Опыт работы с Hugging Face Transformers, LangChain (или аналогичными фреймворками)
Понимание работы с LLM, их настроек и принципов выбора
Опыт разработки RAG (Retrieval-Augmented Generation) архитектур
Prompt engineering и оптимизация запросов к LLM API
Работа с embeddings: создание, сравнение, поиск похожих текстов
Работа с векторными базами данных: Milvus, FAISS, Chroma
Работа с графовыми базами знаний: GraphRAG, Neo4j
Обработка текста: токенизация, нормализация, очистка
Работа с большими текстовыми датасетами для анализа и предиктивной аналитики
Понимание метрик качества для RAG-систем (recall@k, accuracy, faithfulness и т.д.)
Понимание особенностей Guardrails
Знание Structured Output и умение выстраивать workflow на их основе, применение Schema-guided reasoning и иных подходов
Data Science:
Python: middle-уровень (pandas, numpy, scipy)
Работа с данными: загрузка, очистка, предобработка, EDA
Понимание базовых концепций ML: обучение/валидация/тестирование
Понимание особенностей работы с временными рядами
Визуализация данных (matplotlib, seaborn, plotly)
Базовое понимание статистики и теории вероятности
Понимание метрик для различных классов задач (accuracy, precision, recall, F1, recall@k и т.д.)
Умение балансировать производительность, стоимость и качество
Понимание микросервисной архитектуры
Интеграция и развертывание:
Создание API для ML-моделей: FastAPI, Flask, REST API
Работа с базами данных: SQL (PostgreSQL) - средний уровень
NoSQL (MongoDB), графовые базы (Neo4j) - базовый уровень
Асинхронное программирование: asyncio, aiohttp
Базовое понимание веб-разработки
Разработка собственных workflow для интеграции моделей в продукты
Работа с арендованными GPU-серверами
Опыт работы:
2-3 года коммерческого опыта разработки с использованием ML/AI
Наличие реальных проектов с RAG-системами или интеграцией LLM
Опыт работы в команде: понимание процессов разработки, code review, git workflow
Опыт работы по Agile
Опыт интеграции ML-решений в продукты
Soft Skills:
Практичность: умение выбирать подходящие под задачу инструменты
Самостоятельность: способность находить решения под потребности бизнеса
Аналитическое мышление: умение разбираться в проблемах и дебажить проблемы в workflow c LLM
Коммуникация: способность объяснять технические решения нетехническим коллегам
Гибкость: способность переключаться между различными проектами
Желательные навыки (бонусы)
Текстовые модели: (бонус)
Fine-tuning языковых моделей с Unsloth
Опыт работы с библиотеками: PyTorch, TensorFlow, ONNX Runtime, vLLM
Опыт работы с омни-моделями
Компьютерное зрение (бонус):
Опыт работы с OpenCV, Roboflow
Опыт работы с Yolo, CLIP и аналогами
Обработка видео: форматы, кодеки, стриминг (около-реалтайм)
Детекция объектов, трекинг, сегментация
Понимание работы с Vision-Language Models (VLM)
Понимание архитектур: ResNet, EfficientNet, Vision Transformers
Работа с видео-стримами в реальном времени
Обработка речи (бонус):
Работа с STT - Whisper, RIVA, Omnilingual ASR
Синтез речи (TTS), опыт с Silero и аналогичными генераторами
Обработка аудио: librosa, soundfile, pydub
Батчевая обработка аудио

условия

Работа в команде с датасаентистами и аналитиками
Работа по методологии Agile
Работа с арендованными GPU-серверами
Возможность карьерного роста до техлида
Возможность развития в сторону MLOps
Внутрикорпоративное обучение
Ключевые навыки
Python, Machine Learning, Natural Language Processing, RAG, LangChain, Hugging Face, LLM, GPT, BERT, T5, Prompt Engineering, Embeddings, Vector Databases, Qdrant, Chroma, GraphRAG, Neo4j, FastAPI, Flask, PostgreSQL, MongoDB, Deep Learning, Fine-tuning, Data Science, MLOps, API Development, Optimization, Agile, vLLM, Unsloth, Computer Vision, OpenCV, YOLO, Video Processing, Speech Recognition, Whisper, ASR, TTS, GPU

Похожие вакансии

6 вакансии
Яндекс
Яндекс
сегодня

Инженер по оптимизации инфраструктуры RL-обучения

Мы ищем инженера, который будет заниматься оптимизацией инфраструктуры RL-обучения. Важные требования: знание Python, опыт работы с PyTorch и распределённым обучением. Предлагаем интересные задачи и возможность развиваться в области ML.

ML · инфраструктура · оптимизация ·+3

middle удал.
Ренессанс Банк
Ренессанс Банк
сегодня

Разработчик ML-моделей

Присоединяйтесь к команде Ренессанс Банка, где вы будете разрабатывать и улучшать ML-модели. Ищем специалиста с опытом работы в банковской сфере и знанием Python и SQL. Предлагаем гибридный или удаленный формат работы и множество социальных льгот.

middle удал.
Aston
Aston
сегодня

Python Developer

Aston ищет Python Developer с опытом от 1,5 лет для работы над проектами в финтехе. Вы получите возможность развиваться в команде, работать с современными технологиями и участвовать в интересных проектах. Компания предлагает гибкий формат работы и социальный пакет.

middle удал.
YADRO TELECOM
YADRO TELECOM
сегодня

Разработчик симуляторов сетевого оборудования

Вакансия для разработчика симуляторов сетевого оборудования в YADRO TELECOM. Ищем специалиста с опытом разработки на Python и знанием Docker. Предлагаем гибридный формат работы и конкурентную зарплату.

middle удал.
Okko
Okko
сегодня

Auto QA инженер

Вакансия для опытного Auto QA инженера с навыками в Python и UI-автоматизации. Предлагаем удаленную работу, официальное трудоустройство и множество корпоративных преимуществ, включая ДМС и льготные условия ипотеки.

Python · Pytest

middle удал.
Ozon
Ozon
сегодня

QA Automation Engineer

Присоединяйтесь к команде, которая разрабатывает брокерские продукты с акцентом на качество и автоматизацию. Вы будете работать с Python и CI, а также иметь возможность влиять на стратегию тестирования с самого начала проекта.

Python · Pytest · Автоматизация тестирования ·+1

middle удал.