Перейти к содержимому
S
Smartsheet

Инженер по качеству агентов (Agent Quality Engineer)

Smartsheet ищет технического специалиста для обеспечения качества AI-агентов. Вы будете диагностировать причины отказов, разрабатывать системы регрессионного тестирования и улучшать точность и полноту ответов. Требуется опыт с LLM, промпт-инжинирингом и RAG. Предлагается удаленная работа и высокая степень автономии.

удалённо ~2 067 503 – 3 445 838 ₸
Вакансия опубликована 67 дней назад. Может быть уже неактуальна — рекомендуем уточнить статус у работодателя перед откликом.
Языки: Английский · Pre-Intermediate
salary intelligence

Зарплата не указана — оценили по рынку

На основе 278 похожих вакансий за 90 дней.

оценка p25–p75
2 067 503 – 3 445 838 ₸
медиана: 3 032 337 ₸
Хотите увидеть распределение по грейдам и городам? Зарплаты Data/ML Калькулятор зарплат
Вакансии в Telegram-канале
Свежие вакансии Каждый день
Подписаться
??%
Match Score
Войдите и создайте резюме
Войти
описание

Что предстоит делать

Вот перевод текста на русский язык: На протяжении более 20 лет Smartsheet помогает людям и командам достигать — ну, всего. От бесшовного управления работой до умных, масштабируемых решений — мы всегда работали в потоке. Мы создаем инструменты, которые дают командам возможность автоматизировать рутину, находить инсайты и масштабироваться умнее. Но что еще важнее, мы создаем пространство — пространство для масштабных идей, действий и работы, которая действительно имеет значение. Потому что, когда вызов встречается с целью, а страсть превращается в прогресс, это магия в действии, и ради этого мы приходим каждый день. Smartsheet строит следующее поколение управления работой на базе ИИ с помощью SmartAssist, нашей платформы интеллектуальных агентов. По мере того как мы переходим от ранних демо-версий к агентам production-уровня, качество становится критически важным рубежом, и мы ищем **Agent Quality Engineer**, который возьмет на себя эту ответственность. Это не роль в QA. Это глубоко техническая позиция с высокой степенью автономии на стыке оценки LLM, инженерии промптов и контекста, а также генерации с дополнением извлечением (RAG). Вы будете диагностировать причины сбоев наших агентов, проектировать системы для выявления регрессий и добиваться измеримых улучшений в нашем оркестраторе и флоте саб-агентов. Вы будете тесно работать с командами Agent Engineering и AI Platform, будучи частью команды, которая уже запустила инфраструктуру оценки на Databricks/MLflow и движется к созданию зрелого жизненного цикла разработки агентов (ADLC). **Вы будете:** - Отвечать за качество агентов от начала до конца: диагностику, улучшение и валидацию оркестратора и саб-агентов SmartAssist - Выявлять режимы отказов по различным аспектам качества — фактическая точность, полнота, тон, действенность и задержка — и определять приоритеты для исправления - Добиваться улучшений качества с помощью инженерии промптов, настройки RAG, корректировки контекста и улучшения инструментов - Разрабатывать и поддерживать автоматизированные пайплайны оценки на Databricks/MLflow, которые фиксируют регрессии и отслеживают прогресс - Создавать и поддерживать эталонные наборы данных (golden datasets) для оценки агентов, охватывающие реальные сценарии использования - Участвовать в проектировании и рецензировании архитектуры агентов, чтобы обеспечить тестируемость и наблюдаемость с самого начала - Вносить вклад в развивающийся Agent Development Lifecycle (ADLC) в Smartsheet, определяя стандарты и лучшие практики обеспечения качества **Ваш опыт:** - 5+ лет в инженерии качества, разработке ПО или на смежных глубоко технических ролях - Глубокое понимание архитектуры LLM-агентов, включая оркестрацию, RAG, вызов инструментов и управление контекстом - Опыт систематической оценки LLM: методологии, метрики, создание эталонных наборов данных и анализ ошибок - Сильные навыки программирования на Python; опыт работы с Databricks, MLflow или аналогичными платформами для ML/оценки - Опыт работы с CI/CD и автоматизацией тестирования в production-средах - Отличные навыки коммуникации и способность объяснять сложные проблемы качества различной аудитории **Выделитесь среди других:** - Опыт работы с LangChain, LangGraph, CrewAI или другими фреймворками для агентов - Знакомство с observability-инструментами для LLM (такими как Langfuse, Weights & Biases, Arize) - Опыт настройки и дообучения LLM с использованием RLHF или аналогичных методов - Понимание принципов безопасности и ответственного использования ИИ **Почему стоит присоединиться к Smartsheet?** - Бесплатная подписка на Smartsheet - Конкурентная заработная плата и бонусы на основе акций - Полностью оплачиваемая медицинская страховка с низкой франшизой для вас и ваших иждивенцев - Программа 401(k) с взносами компании до 50% от ваших взносов (до лимита, установленного IRS) - Щедрый оплачиваемый отпуск по уходу за ребенком - Ежегодный грант на обучение в размере 5 250 долларов США - Гибкий график работы **Равные возможности трудоустройства** В Smartsheet мы гордимся тем, что являемся работодателем, предоставляющим равные возможности. Мы не дискриминируем по признаку расы, религии, цвета кожи, национального происхождения, пола, сексуальной ориентации, возраста, семейного положения, статуса ветерана или инвалидности. Ваша уникальность приветствуется — присоединяйтесь к нам и создавайте пространство для всех. Пожалуйста, укажите слово **FRESHER** и тег RODguMTk4Ljk5LjE0Mw== при подаче заявки, чтобы показать, что вы полностью прочитали описание вакансии (#RODguMTk4Ljk5LjE0Mw==). Это бета-функция для предотвращения спама от соискателей. Компании могут искать эти слова, чтобы найти кандидатов, которые прочитали это и видят, что они люди.

навыки

Стек и инструменты

Подходит ли вам эта вакансия?

Зарегистрируйтесь и загрузите резюме — посчитаем % совпадения с этой вакансией, подсветим сильные стороны и что стоит подтянуть

Создать аккаунт PDF-парсинг резюме за 2 минуты

Похожие вакансии

6 вакансий
CHI Software
C
CHI Software
сегодня

Инженер данных (Data Engineer)

~2 067 503 – 3 445 838 ₸ оценка

Ищем инженера данных для работы с Snowflake и AWS. Вы будете проектировать и поддерживать ETL/ELT-пайплайны, обеспечивать качество данных и автоматизировать процессы. Требуется опыт работы с облачными технологиями и CI/CD. Удаленная работа, полная занятость.

ETL ELT Snowflake +7
middle удал. dj
Rubytech
R
Rubytech
21 ч. назад

Администратор СУБД (Arenadata DB / Greenplum)

~629 850 – 1 219 325 ₸ оценка

Ищем опытного администратора СУБД для работы с Arenadata DB и Greenplum. Нужно администрировать кластеры, проводить тестирование, автоматизировать задачи с помощью Python и Bash, настраивать CI/CD и мониторинг. Предлагают гибридный график, ДМС, профессиональный рост и работу в аккредитованной IT-компании.

Arenadata DB Greenplum PostgreSQL +11
middle удал. hh
U
UKRSIBBANK BNP Paribas Group
21 ч. назад

Молодший фахівець в Департамент розробки BI системи

~918 890 ₸ оценка

Шукаємо молодшого фахівця для роботи з BI-системою банку. Потрібні знання SQL та реляційних баз даних, досвід з фінансовими даними. Пропонуємо стабільну роботу, медичне страхування, 25 днів відпустки, можливості навчання та кар'єрного зростання.

BI SQL реляційні бази даних +3
junior удал. dou
E
ELVTR
21 ч. назад

Специалист по AI автоматизации и оптимизации

~2 067 503 – 3 445 838 ₸ оценка

Компания ELVTR ищет специалиста по AI автоматизации и оптимизации для улучшения бизнес-процессов. Требуется опыт работы с AI-инструментами и no-code платформами (Zapier, n8n). Предлагается удаленная работа, конкурентная зарплата и бонусы.

AI автоматизация оптимизация процессов +7
middle удал. dou
OBRIO
O
OBRIO
22 ч. назад

Senior/Lead Data Scientist

OBRIO шукає Senior/Lead Data Scientist для роботи над прогнозними моделями в маркетингу. Ви будете вдосконалювати моделі, будувати fraud-detection систему та модель матчингу користувачів. Потрібен досвід 4+ роки в Data Science, Python, SQL, MLOps. Пропонується віддалена робота, сильна команда, 20 днів відпустки та бюджет на навчання.

Data Science Marketing Analytics Python +11
senior удал. dou
H
HOLYWATER TECH
23 ч. назад

Senior/Lead Data Engineer

Строить и поддерживать аналитическую инфраструктуру для продуктов с миллионами пользователей. Нужен опыт с BigQuery, dbt и event-based данными. Предлагают удаленку, обучение и сильную команду.

BigQuery dbt GCS +6
senior удал. dou