4 1 мес. назад

AI-инженер

Ищем AI-инженера с опытом работы с Python и LLM. Вы будете заниматься разработкой и внедрением сложных сервисов, а также обеспечивать их надежность. Работа удаленная и частичная, что позволяет совмещать с основной работой.

middle удалённо
Тип занятости
part-time
Опубликовано
15 декабря 2025
Языки
English: Pre-Intermediate
Вакансии в Telegram-канале
Свежие вакансии Каждый день
Подписаться

описание

AI-инженер Компания:Green Wave Palace ltd Город: РФ (удалённо) Занятость:частичная З/п:по итогам собеседования Оформление:Самозанятость / ИП / ТК РФ ‼️Можно совмещать с основной работой ‼️
Проектировать и внедрять продукционные LLM-сервисы: от ingestion и индексирования данных до генерации ответов и обратной связи пользователей.
Строить RAG-пайплайны: гибридный поиск (векторный + BM25), сжатие контекста, переранжирование (cross-encoder/learning-to-rank), фильтрация по метаданным.
Оркестрировать агентные сценарии (LangChain / LangGraph): планирование шагов, вызов инструментов, обработка ошибок и фолбэков.
MCP (Model Context Protocol): умение поднимать/подключать MCP-серверы и публиковать tools/resources/prompts для хоста (например, Claude/ChatGPT/IDE), понимание безопасности и аутентификации MCP.
Выполнять оценку качества: автоматические и человек-в-контуре (groundedness, factuality, relevance, hallucination rate).
Разрабатывать и поддерживать REST/HTTP API (FastAPI, async/await), сервисные интеграции и очереди фоновой обработки.
Обеспечивать надежность и безопасность: контроль PII, guardrails, валидация и санитизация входных данных.
Обязательные требования
Python 3.x: асинхронщина (asyncio/httpx), типизация, Pydantic, FastAPI, SQLAlchemy. уверенный практический опыт продакшн-бэкенда.
Опыт построения RAG: выбор эмбеддингов (OpenAI, e5, BGE и др.), стратегия чанкинга/оверлапа, индексация и обновление индексов, векторные БД (FAISS, Pinecone, Weaviate), гибридный поиск и переранжирование.
LangChain/LangGraph или любой другой агентский фреймворк. умение собирать цепочки/графы, подключать инструменты, внешние API и хранилища.
Работа с несколькими LLM-провайдерами (OpenAI, Anthropic, Mistral, Gemini, др.), маршрутизация моделей и фолбэки. базовая настройка токен-параметров и системных промптов.
Практика оценки и наблюдаемости: метрики качества, латентности и стоимости. умение построить простую eval-линию.
Желательно (будет плюсом)
LLMOps/Observability: Langfuse/Arize Phoenix, Promptfoo/Ragas, cost & latency dashboards, трейсинг цепочек.
Поиск: Elasticsearch/OpenSearch, гибридный (BM25 + dense), внешние reranker-модели (например, cross-encoder/Cohere ReRank).
Облака и инфраструктура: AWS/GCP/Azure (в т.ч. Azure OpenAI/Bedrock/Vertex), Docker/K8s, очереди (Celery/Kafka), Redis. Jobgether
Мультимодальность (VLM), OCR, извлечение структурированных фактов из документов.

Похожие вакансии

6 вакансии
Bastau Project
Bastau Project
11 ч. назад

Разработчик Python (Django/Wagtail)

Ищем разработчика с опытом работы в веб-разработке для создания корпоративного портала. Основные требования: уверенное владение P…

middle удалённо
БЮРО 1440
БЮРО 1440
12 ч. назад

QA Engineer

Ищем QA Engineer для разработки автотестов и анализа тестов. Требуется знание P…

middle удалённо
Domclick.ru
Domclick.ru
13 ч. назад

Разработчик Python

Вам предстоит реализовывать производительные сервисы на Python, участвовать в проектировании архитектуры и ин…

middle удалённо
GigaChat
GigaChat
1 д. назад

Data Engineer / Developer

Вакансия для Data Engineer / Developer в GigaChat. Основные задачи включают написание пайплайнов обработки данных, улучше…

middle удалённо
Wildberries и Russ
Wildberries и Russ
1 д. назад

Middle+/Senior Python разработчик

Компания Wildberries и Russ ищет Middle+/Senior Python разработчика для работы с ML-моделями и оптимизации инфраструктуры. Требуются г…

middle удалённо
MarfaTech
MarfaTech
1 д. назад

QA Automation Engineer (Python)

Присоединяйтесь к команде MarfaTech в роли QA Automation Engineer, где вы будете разрабатывать и поддерживать автоматизированные тесты для…

middle удалённо