ML-инженер по оптимизации
Ищем ML-инженера для оптимизации инференса больших языковых моделей в децентрализованной сети Gonka. Нужен опыт с PyTorch, CUDA, vLLM и Docker. Предлагаем удаленную работу, доступ к мощным GPU и бонусы за результаты.
Зарплата ниже рынка
На 80% ниже медианы Data/ML по 48 вакансиям за 90 дней.
Что предстоит делать
О нас: Мы являемся ведущим участником децентрализованной AI-сети Gonka (https://gonka.ai/), используя высокопроизводительную GPU-инфраструктуру для максимизации наград за майнинг. Мы ищем инженера по оптимизации машинного обучения (ML Optimization Engineer), который поможет нам достичь превосходной эффективности и веса в экосистеме Gonka. Ключевые обязанности: Внедрять продвинутые оптимизации инференса (спекулятивное декодирование, квантизация, модификации механизма внимания и т.д.) для максимизации веса майнинга — техники, уже доказавшие свою способность удваивать вес на идентичных GPU у других участников Тонко настраивать конфигурации Docker для различных моделей GPU на основе доступного реестра Разрабатывать собственные стратегии оптимизации, балансирующие пропускную способность и качество Создавать и поддерживать собственные Docker-образы, оптимизированные для конкретных архитектур GPU Проектировать и внедрять системы для стабильного и масштабируемого майнинга Gonka и других протоколов Разрабатывать оптимизированные образы для Tenstorrent AI ASIC для расширения нашей аппаратной экосистемы за пределы текущего развертывания GPU Переносить Python-код и реализации VLLM на новые образы VLLM и адаптировать их для конкретных видеокарт Необходимые требования: Подтвержденный опыт работы с техниками оптимизации больших языковых моделей Глубокое понимание архитектур трансформеров и механизмов внимания Владение PyTorch, CUDA и техниками оптимизации GPU Опыт работы с vLLM, FlashInfer или аналогичными фреймворками оптимизации инференса Знакомство с контейнеризацией Docker и управлением рабочими нагрузками GPU Желательные требования: Опыт работы с Claude Code Max (будет предоставлен при необходимости) Предыдущий опыт работы с Gonka или аналогичными децентрализованными AI-сетями Опыт в соревновательном ML или оптимизации распределенных систем Опыт работы с архитектурами NVIDIA GPU (B200/B300/H200/H100/A100) Знание Tenstorrent AI ASIC или других специализированных AI-чипов
Что предлагаем
Стек и инструменты
Подходит ли вам эта вакансия?
Зарегистрируйтесь и загрузите резюме — посчитаем % совпадения с этой вакансией, подсветим сильные стороны и что стоит подтянуть
Похожие вакансии
6 вакансий
Data Engineer / Аналитик данных (DWH)
~1 945 880 – 3 495 051 ₸ оценка
Ищем Data Engineer для построения корпоративного хранилища данных в международном косметическом бренде. Нужно проектировать DWH, разрабатывать SQL-запросы и витрины данных, работать с DBT и Data Vault. Предлагают 100% удаленную работу и стабильную зарплату.
Data Scientist / Machine Learning Engineer
~1 581 028 ₸ оценка
Шукаємо Data Scientist / Machine Learning Engineer для роботи над AI-рішеннями в сфері OSINT. Потрібен досвід від 2 років, глибокі знання машинного навчання, Python та NLP. Пропонуємо віддалену роботу, гнучкий графік та цікаві задачі.
Эксперт по аналитике и стратегии вовлечения клиентов
Neon ищет эксперта по аналитике для руководства стратегией вовлечения клиентов. Вы будете работать с большими данными (SQL), строить финансовые модели, проводить A/B тесты и взаимодействовать с топ-менеджментом. Требуется продвинутый SQL, понимание юнит-экономики и опыт в экспериментах. Компания предлагает полную удаленку, бенефиты и работу в динамичной финтех-среде.
Practice Lead AI
~1 581 028 ₸ оценка
IT SmartFlex, дочірня компанія Vodafone Ukraine, шукає Practice Lead AI для розвитку напряму штучного інтелекту. Роль поєднує бізнес-консалтинг, пресейл та координацію технічних експертів, фокус на перетворенні AI-можливостей на комерційні послуги. Потрібен досвід у пресейлі, розвитку бізнесу та знання Azure/AWS AI.
Старший AI Solution Architect
Ищем старшего AI Solution Architect для работы с Langchain и архитектурой AI-решений. Требуется опыт в AI и архитектуре. Предлагается удаленная работа.
Инженер-программист с навыками ML и работы с данными
Ищем Middle-инженера для работы с данными и машинным обучением. Требуется знание Python, Data engineering и Airflow. Предлагаем удаленную работу в международной компании.