22 1 мес. назад

Разработчик бэкенда GenAI

Ищем разработчика бэкенда для работы с GenAI. Основные задачи включают разработку чат-ботов, интеграцию с API и написание тестов. Предлагаем годовой бонус, ДМС и поддержку команды экспертов.

middle гибрид, Алматы
Тип занятости
full-time
Опубликовано
21 ноября 2025
Языки
English: Pre-Intermediate
Вакансии в Telegram-канале
Свежие вакансии Каждый день
Подписаться

описание

Разрабатывать бэкенд-сервисы GenAI: чат-боты, ассистенты/«агенты» с инструментами (tools/function calling), автомations и интеграции с внутренними системами.
Реализовывать RAG-потоки: подготовка пайплайна эмбеддингов, поиск/ранжирование, контекстуализация, защита от prompt-injection/PII-leaks.
Проектировать и внедрять API (REST/gRPC), поддерживать версионирование, совместимость и контрактные тесты.
Интеграции с внешними API и каналами (телеграм/вотсап/веб-виджет/контакт-центр), обработка веб-хуков, очередей и ретраев.
Писать надёжный асинхронный код: timeouts, backoff, bulkheads, идемпотентность, транзакционные outbox-паттерны.
Настраивать наблюдаемость: метрики/логи/трейсы, алерты по SLO; разбор и профилирование узких мест.
Писать тесты (unit/интеграционные/контрактные), конфигурировать пайплайны CI/CD, автоматизировать релизы.
Взаимодействовать с DS/ML по вопросам инференса/оценок качества (RAGAS/precision/latency), улучшать промпты/инструменты.
Поддерживать безопасность: секреты, токены, контроль доступа (RBAC), маскирование PII, ограничения по скоростям/квотам.
Подготавливать документацию (ADR, runbooks, OpenAPI), участвовать в код-ревью и внутренних RFC.

требования

LLM и агенты
Опыт с OpenAI/Azure OpenAI и локальными моделями (Llama, Mistral).
Function calling, структурированные ответы (JSON Schema), управление состоянием (memory/state).
RAG и данные
LangChain, LlamaIndex, RAGFlow или аналоги.
Эмбеддинги, чанкирование, перезапросы, ранжирование.
Векторные БД
pgvector, FAISS, Qdrant, Milvus; проектирование схем хранения и индексов.
Очереди и фоновые задачи
Kafka/Redpanda, KEDA, Celery/Temporal.
Сервис инференса
vLLM, Triton, KServe — интеграция через API.
Интеграции с каналами
Telegram Bot API, WhatsApp (Infobip/Twilio), вебхуки; управление rate-limits и идемпотентностью.
Feature flags / конфигурация
LaunchDarkly, Unleash или собственные решения.
Фронтенд (желательно)
React или Vue для внутренних тулов.

условия

Годовой бонус по результатам работы
ДМС, материальная помощь, социальная поддержка, ежедневное медицинское сопровождение и др.
Команда экспертов, которые любят своё дело и всегда готовы поддержать
Современный офис и вся необходимая техника предоставляется.

Похожие вакансии

6 вакансии
Social Links
Social Links
1 д. назад

Опытный Backend разработчик (Python, Django)

Вам предстоит развивать и поддерживать систему управления контейнерами, работать с Linux-серверами и Docker, а также участвовать в проектировании архитектуры. Иде…

middle удалённо
Social Links
Social Links
1 д. назад

Старший Python разработчик (Сбор данных / Веб-скрейпинг)

Вакансия для старшего Python разработчика в компании Social Links, занимающейся сбором и анализом данных. Идеальный кандидат должен иметь оп…

senior удалённо
Bastau Project
Bastau Project
12 ч. назад

Разработчик Python (Django/Wagtail)

Ищем разработчика с опытом работы в веб-разработке для создания корпоративного портала. Основные требования: уверенное владение P…

middle удалённо
БЮРО 1440
БЮРО 1440
12 ч. назад

QA Engineer

Ищем QA Engineer для разработки автотестов и анализа тестов. Требуется знание P…

middle удалённо
Domclick.ru
Domclick.ru
13 ч. назад

Разработчик Python

Вам предстоит реализовывать производительные сервисы на Python, участвовать в проектировании архитектуры и ин…

middle удалённо
GigaChat
GigaChat
1 д. назад

Data Engineer / Developer

Вакансия для Data Engineer / Developer в GigaChat. Основные задачи включают написание пайплайнов обработки данных, улучше…

middle удалённо