22
1 мес. назад
Разработчик бэкенда GenAI
Ищем разработчика бэкенда для работы с GenAI. Основные задачи включают разработку чат-ботов, интеграцию с API и написание тестов. Предлагаем годовой бонус, ДМС и поддержку команды экспертов.
middle
гибрид, Алматы
Тип занятости
full-time
Опубликовано
21 ноября 2025
Языки
English: Pre-Intermediate
Вакансии в Telegram-канале
Свежие вакансии
Каждый день
описание
Разрабатывать бэкенд-сервисы GenAI: чат-боты, ассистенты/«агенты» с инструментами (tools/function calling), автомations и интеграции с внутренними системами.
Реализовывать RAG-потоки: подготовка пайплайна эмбеддингов, поиск/ранжирование, контекстуализация, защита от prompt-injection/PII-leaks.
Проектировать и внедрять API (REST/gRPC), поддерживать версионирование, совместимость и контрактные тесты.
Интеграции с внешними API и каналами (телеграм/вотсап/веб-виджет/контакт-центр), обработка веб-хуков, очередей и ретраев.
Писать надёжный асинхронный код: timeouts, backoff, bulkheads, идемпотентность, транзакционные outbox-паттерны.
Настраивать наблюдаемость: метрики/логи/трейсы, алерты по SLO; разбор и профилирование узких мест.
Писать тесты (unit/интеграционные/контрактные), конфигурировать пайплайны CI/CD, автоматизировать релизы.
Взаимодействовать с DS/ML по вопросам инференса/оценок качества (RAGAS/precision/latency), улучшать промпты/инструменты.
Поддерживать безопасность: секреты, токены, контроль доступа (RBAC), маскирование PII, ограничения по скоростям/квотам.
Подготавливать документацию (ADR, runbooks, OpenAPI), участвовать в код-ревью и внутренних RFC.
требования
LLM и агенты
Опыт с OpenAI/Azure OpenAI и локальными моделями (Llama, Mistral).
Function calling, структурированные ответы (JSON Schema), управление состоянием (memory/state).
RAG и данные
LangChain, LlamaIndex, RAGFlow или аналоги.
Эмбеддинги, чанкирование, перезапросы, ранжирование.
Векторные БД
pgvector, FAISS, Qdrant, Milvus; проектирование схем хранения и индексов.
Очереди и фоновые задачи
Kafka/Redpanda, KEDA, Celery/Temporal.
Сервис инференса
vLLM, Triton, KServe — интеграция через API.
Интеграции с каналами
Telegram Bot API, WhatsApp (Infobip/Twilio), вебхуки; управление rate-limits и идемпотентностью.
Feature flags / конфигурация
LaunchDarkly, Unleash или собственные решения.
Фронтенд (желательно)
React или Vue для внутренних тулов.
условия
Годовой бонус по результатам работы
ДМС, материальная помощь, социальная поддержка, ежедневное медицинское сопровождение и др.
Команда экспертов, которые любят своё дело и всегда готовы поддержать
Современный офис и вся необходимая техника предоставляется.
Похожие вакансии
6 вакансии
Опытный Backend разработчик (Python, Django)
Вам предстоит развивать и поддерживать систему управления контейнерами, работать с Linux-серверами и Docker, а также участвовать в проектировании архитектуры. Иде…
middle
удалённо
Старший Python разработчик (Сбор данных / Веб-скрейпинг)
Вакансия для старшего Python разработчика в компании Social Links, занимающейся сбором и анализом данных. Идеальный кандидат должен иметь оп…
senior
удалённо
Разработчик Python (Django/Wagtail)
Ищем разработчика с опытом работы в веб-разработке для создания корпоративного портала. Основные требования: уверенное владение P…
middle
удалённо
QA Engineer
Ищем QA Engineer для разработки автотестов и анализа тестов. Требуется знание P…
middle
удалённо