4 3 мес. назад

AI Research Engineer (Reinforcement Learning)

Tether ищет AI-инженера для работы над обучением с подкреплением. Вы будете разрабатывать RL-алгоритмы, проводить эксперименты и интегрировать агентов в продакшн. Требуется опыт с PyTorch, GRPO и публикации на A* конференциях. Работа полностью удаленная.

senior удалённо ~2 147 320 ₸

Вакансия опубликована 108 дней назад. Может быть уже неактуальна — рекомендуем уточнить статус у работодателя перед откликом.

Войти и откликнуться WWR

Языки: English · Advanced

salary intelligence

Зарплата не указана — оценили по рынку

На основе 102 похожих вакансий за 90 дней.

оценка p25–p75

1 492 500 – 3 113 208 ₸

медиана: 2 147 320 ₸

Хотите увидеть распределение по грейдам и городам? Зарплаты Python Калькулятор зарплат

Вакансии в Telegram-канале

Свежие вакансии Каждый день

??%

Match Score

Войдите и создайте резюме

Войти

описание

Что предстоит делать

Штаб-квартира: El Salvador URL: https://careers.tether.io/ Почему стоит присоединиться к нам? Наша команда — это глобальный центр талантов, работающий удаленно из всех уголков мира. Если вы увлечены идеей оставить след в сфере fintech, это ваша возможность сотрудничать с одними из самых ярких умов, раздвигая границы и устанавливая новые стандарты. Мы быстро выросли, остались гибкими и закрепили за собой место лидера в индустрии. Если у вас отличные навыки общения на английском языке и вы готовы внести вклад в самую инновационную платформу на планете, Tether — это место для вас. Готовы ли вы стать частью будущего?   О вакансии Будучи членом команды по разработке AI-моделей, вы будете стимулировать инновации в подходах к обучению с подкреплением для продвинутых моделей. Ваша работа будет оптимизировать принятие решений и адаптивное поведение, чтобы обеспечить повышенный интеллект, улучшенную производительность и возможности, специфичные для предметной области, для решения реальных задач. Вы будете работать с широким спектром систем, включая ресурсоэффективные модели, предназначенные для ограниченных аппаратных сред, и сложные мультимодальные архитектуры, интегрирующие такие данные, как текст, изображения и аудио. Мы ожидаем, что у вас есть глубокие знания в области проектирования систем обучения с подкреплением и солидный опыт работы с продвинутыми архитектурами моделей. Вы будете применять практический, исследовательский подход к разработке, тестированию и внедрению новых алгоритмов обучения с подкреплением и фреймворков для обучения. В ваши обязанности входит курирование специализированных сред симуляции и обучающих наборов данных, укрепление базовой производительности политики, а также выявление и устранение узких мест в процессе обучения с подкреплением. Конечная цель — раскрыть превосходную, адаптированную к предметной области производительность AI и расширить границы того, чего эти модели могут достичь в динамичных реальных средах.  

Разрабатывать и внедрять передовые алгоритмы обучения с подкреплением, предназначенные для оптимизации процессов принятия решений как в симулированных, так и в реальных условиях. Устанавливать четкие целевые показатели производительности, такие как максимизация вознаграждения и стабильность политики.
Создавать, запускать и контролировать контролируемые эксперименты по обучению с подкреплением. Отслеживать ключевые показатели эффективности, документируя итеративные результаты и сравнивая результаты с установленными эталонами.
Выявлять и курировать высококачественные среды симуляции и обучающие наборы данных, адаптированные к конкретным предметным задачам. Устанавливать измеримые критерии, чтобы гарантировать, что отбор и подготовка этих ресурсов значительно улучшают процесс обучения и общую производительность модели.
Систематически отлаживать и оптимизировать конвейер обучения с подкреплением, анализируя как вычислительную эффективность, так и показатели производительности обучения. Решать такие проблемы, как шум сигнала вознаграждения, стратегия исследования и расхождение политики, для улучшения сходимости и стабильности.
Сотрудничать с кросс-функциональными командами для интеграции агентов обучения с подкреплением в производственные системы. Определять четкие показатели успеха, такие как улучшение производительности в реальных условиях и устойчивость при различных условиях, а также обеспечивать непрерывный мониторинг и итеративные доработки для устойчивой адаптации к предметной области.
Требования к кандидату
Степень в области компьютерных наук или смежной области. Желательно PhD в области NLP, машинного обучения или смежной области, дополненный солидным опытом в AI R&D (с хорошими публикациями на конференциях уровня A*).
Обязателен подтвержденный опыт работы с крупномасштабными экспериментами по обучению с подкреплением, включая методы онлайн RL, такие как Group Relative Policy Optimization (GRPO). Ваш вклад должен привести к измеримым улучшениям в принятии решений в конкретной предметной области и общей производительности политики.
Требуется глубокое понимание алгоритмов обучения с подкреплением, включая современные методы онлайн RL и другие подходы градиентной оптимизации, такие как policy gradients, actor-critic и GRPO. Ваш опыт должен подчеркивать улучшение стабильности политики, исследования и эффективности выборки в сложных динамических средах.
Обязательно наличие сильных навыков работы с PyTorch и соответствующими фреймворками обучения с подкреплением. Ожидается практический опыт разработки конвейеров RL — от симуляции и онлайн-обучения до оценки после обучения и развертывания решений на основе RL в производственных средах.
Подтвержденная способность применять эмпирические исследования для преодоления проблем обучения с подкреплением, таких как неэффективность выборки, компромиссы между исследованием и эксплуатацией, а также нестабильность обучения. Вы должны уметь разрабатывать надежные фреймворки для оценки и итеративно внедрять алгоритмические инновации, чтобы постоянно расширять границы производительности RL-агентов.
 
Важная информация для кандидатов
Мошенничество при найме становится все более распространенным. Чтобы защитить себя, пожалуйста, учитывайте следующее при подаче заявок на вакансии:
Подавайте заявки только через наши официальные каналы. Мы не используем сторонние платформы или агентства для найма, если это не указано явно. Все открытые вакансии перечислены на нашей официальной странице карьеры: https://tether.recruitee.com/
Проверяйте личность рекрутера. Все наши рекрутеры имеют подтвержденные профили в LinkedIn. Если вы сомневаетесь, вы можете подтвердить их личность, проверив их профиль или связавшись с нами через наш сайт.
Будьте осторожны с необычными методами связи. Мы не проводим собеседования через WhatsApp, Telegram или SMS. Вся коммуникация осуществляется через официальные корпоративные email-адреса и платформы.
Дважды проверяйте адреса электронной почты. Вся коммуникация от нас будет приходить с адресов, заканчивающихся на @tether.to или @tether.io
Мы никогда не будем запрашивать платежи или финансовые данные. Если кто-то просит личную финансовую информацию или оплату на любом этапе процесса найма, это мошенничество. Пожалуйста, немедленно сообщите об этом.
Для подачи заявки: https://weworkremotely.com/remote-jobs/tether-ai-research-engineer

навыки

Стек и инструменты

Reinforcement Learning PyTorch Machine Learning NLP AI GRPO Deep Learning

Telegram WhatsApp

грейд

senior

формат

удалённо

зарплата

~2 147 320 ₸

оценка на основе 102 похожих вакансий

языки

English — Advanced

Открыть на WWR

Создать резюме

Узнайте Match Score и отслеживайте отклики

В избранное

компания

Tether

Tether — ведущая компания в сфере блокчейн-технологий и цифровых активов, стремящаяся к инновациям в децентрализованных финансах. Мы разрабатываем пер...

вакансия

2 мес. назад

на сайте

Все вакансии Tether

Ваше соответствие

??%

Match Score

войдите и создайте резюме

Войти

Telegram WhatsApp

Подходит ли вам эта вакансия?

Зарегистрируйтесь и загрузите резюме — посчитаем % совпадения с этой вакансией, подсветим сильные стороны и что стоит подтянуть

Создать аккаунт PDF-парсинг резюме за 2 минуты

??%

Match Score

Похожие вакансии

6 вакансий

Bell Integrator

2 д. назад

Backend-разработчик Python

~2 147 320 ₸ оценка

Разработка и поддержка микросервисных интеграционных систем для банковского сектора. Требуется опытный Python-разработчик с глубокими знаниями архитектуры и брокеров сообщений. Компания предлагает удаленный формат работы и возможности профессионального роста.

Python Backend Микросервисы +11

senior удал. hh hh.kz

SevenPro

2 д. назад

Python инженер (Forecast / Economics Teams)

~2 147 320 ₸ оценка

Разработка бэкенд-сервисов на Python для облачного SaaS-продукта в нефтегазовой отрасли. Требуется опыт от 5 лет, владение FastAPI, MongoDB, GCP и инструментами анализа данных. Предлагается удаленная работа, возможность влиять на архитектуру и прямая коммуникация с руководством.

Python FastAPI Flask +10

senior удал. dou DOU.ua

Иностранное унитарное предприятие Адмитад

2 д. назад

Senior Python Developer

~2 147 320 ₸ оценка

Ищем опытного Python-разработчика для создания веб-приложений. Требуется уверенное владение Django, реляционными базами данных, Redis, Kafka и RabbitMQ. Предлагается гибридный график, медстраховка и обучение.

Python Django Django ORM +6

senior удал. hh hh.kz

ElmoSoft

2 д. назад

Старший Python Back-End разработчик

~2 147 320 ₸ оценка

ElmoSoft ищет Senior Python разработчика для работы над криптовалютным и блокчейн проектом. Нужен опыт с Python, микросервисами, Kubernetes и блокчейн технологиями. Предлагают полностью удаленную работу и конкурентную зарплату.

Python PHP SQL +14

senior удал. hh hh.kz

Preply

2 д. назад

Staff Engineer (Python)

~786 966 ₸ оценка

Preply ищет опытного Staff Engineer (Python) для работы над AI-обучением или монетизацией. Вы будете формировать техническую стратегию, вести архитектуру и ключевые проекты. Требуется глубокий Python, системное мышление и умение влиять на команду. Предлагается удалёнка, опционы и страховка.

Python AI масштабирование +4

senior удал. dou DOU.ua

Preply

3 д. назад

Старший II Full Stack инженер

~2 147 320 ₸ оценка

Preply, EdTech-единорог, ищет Senior II Full Stack инженера. Вы будете разрабатывать масштабируемые бэкенд-системы на Python/Django и интерфейсы на React/TypeScript, участвовать в архитектурных решениях и менторить коллег. Требуется опыт в крупных веб-приложениях, техническое лидерство и английский B2+. Предлагают конкурентную зарплату, опционы и гибкий график.

Python Django React +7

senior удал. dou DOU.ua

Источник Резюме + Match Score