4
1 мес. назад
AI-инженер
Ищем AI-инженера с опытом работы с Python и LLM. Вы будете заниматься разработкой и внедрением сложных сервисов, а также обеспечивать их надежность. Работа удаленная и частичная, что позволяет совмещать с основной работой.
middle
удалённо
Тип занятости
part-time
Опубликовано
15 декабря 2025
Языки
English: Pre-Intermediate
Вакансии в Telegram-канале
Свежие вакансии
Каждый день
описание
AI-инженер
Компания:Green Wave Palace ltd
Город: РФ (удалённо)
Занятость:частичная
З/п:по итогам собеседования
Оформление:Самозанятость / ИП / ТК РФ
‼️Можно совмещать с основной работой ‼️
Проектировать и внедрять продукционные LLM-сервисы: от ingestion и индексирования данных до генерации ответов и обратной связи пользователей.
Строить RAG-пайплайны: гибридный поиск (векторный + BM25), сжатие контекста, переранжирование (cross-encoder/learning-to-rank), фильтрация по метаданным.
Оркестрировать агентные сценарии (LangChain / LangGraph): планирование шагов, вызов инструментов, обработка ошибок и фолбэков.
MCP (Model Context Protocol): умение поднимать/подключать MCP-серверы и публиковать tools/resources/prompts для хоста (например, Claude/ChatGPT/IDE), понимание безопасности и аутентификации MCP.
Выполнять оценку качества: автоматические и человек-в-контуре (groundedness, factuality, relevance, hallucination rate).
Разрабатывать и поддерживать REST/HTTP API (FastAPI, async/await), сервисные интеграции и очереди фоновой обработки.
Обеспечивать надежность и безопасность: контроль PII, guardrails, валидация и санитизация входных данных.
Обязательные требования
Python 3.x: асинхронщина (asyncio/httpx), типизация, Pydantic, FastAPI, SQLAlchemy. уверенный практический опыт продакшн-бэкенда.
Опыт построения RAG: выбор эмбеддингов (OpenAI, e5, BGE и др.), стратегия чанкинга/оверлапа, индексация и обновление индексов, векторные БД (FAISS, Pinecone, Weaviate), гибридный поиск и переранжирование.
LangChain/LangGraph или любой другой агентский фреймворк. умение собирать цепочки/графы, подключать инструменты, внешние API и хранилища.
Работа с несколькими LLM-провайдерами (OpenAI, Anthropic, Mistral, Gemini, др.), маршрутизация моделей и фолбэки. базовая настройка токен-параметров и системных промптов.
Практика оценки и наблюдаемости: метрики качества, латентности и стоимости. умение построить простую eval-линию.
Желательно (будет плюсом)
LLMOps/Observability: Langfuse/Arize Phoenix, Promptfoo/Ragas, cost & latency dashboards, трейсинг цепочек.
Поиск: Elasticsearch/OpenSearch, гибридный (BM25 + dense), внешние reranker-модели (например, cross-encoder/Cohere ReRank).
Облака и инфраструктура: AWS/GCP/Azure (в т.ч. Azure OpenAI/Bedrock/Vertex), Docker/K8s, очереди (Celery/Kafka), Redis. Jobgether
Мультимодальность (VLM), OCR, извлечение структурированных фактов из документов.
Похожие вакансии
6 вакансии
Разработчик Python (Django/Wagtail)
Ищем разработчика с опытом работы в веб-разработке для создания корпоративного портала. Основные требования: уверенное владение P…
middle
удалённо
QA Engineer
Ищем QA Engineer для разработки автотестов и анализа тестов. Требуется знание P…
middle
удалённо
Разработчик Python
Вам предстоит реализовывать производительные сервисы на Python, участвовать в проектировании архитектуры и ин…
middle
удалённо
Data Engineer / Developer
Вакансия для Data Engineer / Developer в GigaChat. Основные задачи включают написание пайплайнов обработки данных, улучше…
middle
удалённо