Перейти к содержимому

Инженер-исследователь AI-агентов

Разработка и улучшение AI-агентов для бизнес-платформы Bos.pro. Нужно исследовать и настраивать скиллы, тестировать модели, строить оценки качества и переносить успешные паттерны в продакшн. Требуется опыт с LLM, TypeScript, PostgreSQL и исследовательский подход.

middle удалённо ~500 000 – 800 000 ₸
Вакансия опубликована 46 дней назад. Может быть уже неактуальна — рекомендуем уточнить статус у работодателя перед откликом.
Языки: English · Pre-Intermediate
salary intelligence

Зарплата не указана — оценили по рынку

На основе 8 похожих вакансий за 90 дней.

оценка p25–p75
500 000 – 800 000 ₸
медиана: 500 000 ₸
Хотите увидеть распределение по грейдам и городам? Зарплаты Data/ML Калькулятор зарплат
Вакансии в Telegram-канале
Свежие вакансии Каждый день
Подписаться
??%
Match Score
Войдите и создайте резюме
Войти
описание

Что предстоит делать

Большинство команд просто покупают модель подороже и надеются, что она решит проблему. Мы идём другим путём: разрабатываем платформу, на которой даже средняя модель начинает стабильно решать реальные инженерные задачи. Мы ищем инженера-исследователя, который будет собирать и тестировать такие системы для Bos.pro: разбирать, почему агент ошибается, что усиливает результат и какие паттерны можно перенести в продакшн. О ПРОДУКТЕ Bos.pro — операционная система для бизнеса (Business Operating System). Платформа, где предприниматель собирает компанию из готовых модулей (CRM, HR, Tasks, Support, Events) и встраивает AI-агентов в ежедневную работу бизнеса. Продукт в стадии бета с активными пользователями. ЧТО ДЕЛАТЬ — Исследовать и улучшать harness для AI-разработки бизнес-приложений Bos.pro: контекстные паки, промпты, агентные сценарии, вызовы тулзов, скиллы, проверки. — Находить, создавать и адаптировать скиллы — наборы инструкций, примеров и ограничений, которые усиливают модель на конкретных типах задач: генерация модулей, правка логики, работа с данными. — Тестировать, какие модели и настройки лучше решают задачи конкретных модулей: CRM, HR, Tasks и других. — Строить оценки (evals), регрессионные тесты и контрольные точки качества для кода, сгенерированного AI. — Разбирать ошибки агентов: где потерян контекст, где сломана логика, где нужна дополнительная валидация. — Описывать удачные паттерны и переносить их в продакшн-пайплайны Bos.pro. ТЫ НАМ ПОДХОДИШЬ, ЕСЛИ: — Просыпаешься ночью запустить агентов — Готов к полному коммитменту — Понимаешь, что качество результата зависит не от модели, а от системы вокруг неё: контекст, скиллы, тулзы, оценки, обратная связь. Или пока интуитивно чувствуешь это — и готов разобраться на практике. — Следишь за тем, что происходит в AI-разработке: читаешь X Карпатого, следишь за обновлениями Claude Code, Cursor, Codex, OpenCode. — Мониторишь GitHub в поисках новых скиллов, harness-паттернов, eval-фреймворков и идей — или хочешь начать это делать и понимаешь зачем. — Читаешь arxiv, блоги и ченджлоги инструментов. Пример того, что мы исследуем: https://arxiv.org/abs/2604.14228v1 — Работаешь исследовательски: формулируешь гипотезу, ставишь эксперимент, измеряешь результат, делаешь вывод. Не «попробовал и вроде работает», а «замерил на 50 задачах и вот данные». Или пока не замерял — но понимаешь, почему это правильный подход. — И самое главное: берешь ответственность, растешь от боли признанных ошибок ИНСТРУМЕНТЫ И СТЕК — AI-dev пайплайн как рабочий инструмент: Claude Code, Cursor, Codex, Windsurf, OpenCode или аналоги — настроены под твой процесс. — Опыт или понимание работы с LLM API, function calling, MCP, агентными фреймворками. — Знакомство с оценками (evals), бенчмарк-сценариями, тестовыми стендами (lm-eval-harness, SWE-bench или собственные) — на уровне использования или готовности разобраться. — Supabase / PostgreSQL. — TypeScript / JavaScript / React — умеешь читать, дебажить и улучшать код, даже если основная работа — не писать его руками. — Docker, CI/CD, изолированные среды выполнения. — Понимание бэкенд-логики, REST API, SQL. — Хакатоны, опенсорс, свои AI-автоматизации — всё, что показывает, что ты строишь, а не просто читаешь. НАЙМ: — Покажи, как устроен твой рабочий пайплайн и агентский харнессинг на хакатоне — На следующий день cделай рывок с нами — выполни задачку по теме, удиви нас — После — обсуждение деталей и оффер

навыки

Стек и инструменты

Подходит ли вам эта вакансия?

Зарегистрируйтесь и загрузите резюме — посчитаем % совпадения с этой вакансией, подсветим сильные стороны и что стоит подтянуть

Создать аккаунт PDF-парсинг резюме за 2 минуты

Ещё в Cloved

4 активные вакансии в компании

6 д. назад

ИИ-инженер (AI Engineer)

~1 657 500 – 2 652 000 ₸ оценка

Создаём платформу, где ИИ-агенты сами ведут бизнес-приложения. Ищем инженера, который будет проектировать и развивать ядро агентов: от планирования до отката. Нужен опыт с TypeScript, Node/Deno, Postgres и практическая работа с LLM. Работа полностью удалённая, возможен part-time.

TypeScript Node.js Deno +12
senior удал. hh
1 мес. назад

Senior AI Agent Engineer (Agentic Scaffolding)

Ищем Senior-инженера для создания платформы, где AI-агенты автономно управляют бизнесами. Нужно проектировать архитектуру агентов (goal graph, память, оркестрация) и внедрять Spec-Driven разработку. Требуется опыт с open-source инструментами для агентов и умение работать в стартап-режиме. Предлагаем удалённую работу и быстрый оффер.

Spec-Driven Development Agentic Scaffolding AI Agents +24
senior удал. hh
5 мес. назад

Разработчик вайбкод платформы

~1 170 552 ₸ оценка

Ищем разработчика для вайбкод платформы Cloved. Нужно быстро править и дорабатывать проекты под клиентов, работать с ИИ и архитектурой. Стек не важен, главное — достижения и умение разбираться в ошибках ИИ. Предлагают удалёнку, опционы и оплату в твёрдой валюте.

вайбкод ИИ React.js +12
senior удал. hh

Похожие вакансии

6 вакансий
CHI Software
C
CHI Software
сегодня

Инженер данных (Data Engineer)

~2 067 503 – 3 445 838 ₸ оценка

Ищем инженера данных для работы с Snowflake и AWS. Вы будете проектировать и поддерживать ETL/ELT-пайплайны, обеспечивать качество данных и автоматизировать процессы. Требуется опыт работы с облачными технологиями и CI/CD. Удаленная работа, полная занятость.

ETL ELT Snowflake +7
middle удал. dj
Rubytech
R
Rubytech
21 ч. назад

Администратор СУБД (Arenadata DB / Greenplum)

~629 850 – 1 219 325 ₸ оценка

Ищем опытного администратора СУБД для работы с Arenadata DB и Greenplum. Нужно администрировать кластеры, проводить тестирование, автоматизировать задачи с помощью Python и Bash, настраивать CI/CD и мониторинг. Предлагают гибридный график, ДМС, профессиональный рост и работу в аккредитованной IT-компании.

Arenadata DB Greenplum PostgreSQL +11
middle удал. hh
E
ELVTR
21 ч. назад

Специалист по AI автоматизации и оптимизации

~2 067 503 – 3 445 838 ₸ оценка

Компания ELVTR ищет специалиста по AI автоматизации и оптимизации для улучшения бизнес-процессов. Требуется опыт работы с AI-инструментами и no-code платформами (Zapier, n8n). Предлагается удаленная работа, конкурентная зарплата и бонусы.

AI автоматизация оптимизация процессов +7
middle удал. dou
Edvantis
E
Edvantis
1 д. назад

Middle инженер генеративного ИИ

Ищем Middle инженера генеративного ИИ для создания AI-агентов для бэкенд-продуктов. Требуется опыт работы с LLM, Python, FastAPI, LangChain и RAG. Предлагаем удаленную работу, гибкий график, обучение и медицинскую страховку.

Generative AI LLM Python +13
middle удал. dou
Kiss My Apps
K
Kiss My Apps
1 д. назад

Middle Marketing Analyst

~2 067 503 – 3 445 838 ₸ оценка

Шукаємо Middle Marketing Analyst для роботи з маркетинговою аналітикою в продуктовій компанії. Потрібен досвід з SQL та BI, бажання розвиватися в маркетинговому домені. Пропонуємо віддалену роботу, конкурентну зарплату та можливості для зростання.

Marketing Analytics SQL BI +6
middle удал. dou
E
Evolved Ideas
1 д. назад

Data Engineer

~2 067 503 – 3 445 838 ₸ оценка

Ищем Data Engineer с опытом работы со Snowflake, SQL, Python и DBT. Нужно будет работать с данными, создавать отчеты Power BI и взаимодействовать с клиентами. Предлагают удаленную работу, страховку и бюджет на обучение.

Snowflake SQL Python +7
middle удал. dou