описание
Зарплата: Конкурентоспособная, в зависимости от опыта
Работа: Удалённая
Описание компании
Qoves на пути к тому, чтобы стать следующим единорогом в сфере потребительских технологий. С более чем 2,5 миллиона подписчиков на наших платформах, мы создали одно из крупнейших мировых сообществ вокруг красоты, эстетики и ИИ. Всего за короткое время мы стали одной из самых быстрорастущих компаний в сфере потребительских технологий в мире, внедряя анализ лиц на основе ИИ, который трансформирует понимание и улучшение внешности людей.
Наши продукты варьируются от потребительских отчетов по анализу лиц до партнёрств с ведущими клиниками. Мы быстро масштабируемся, расширяем нашу команду и устанавливаем новые стандарты в пересечении технологий и эстетики. Это ваша возможность присоединиться к компании, которая не просто растёт, но и переосмысляет целую индустрию.
Описание роли
Мы ищем опытного DevOps Engineer, который присоединится к нашей команде на полный рабочий день в удалённом формате. Вы будете отвечать за надёжность, масштабируемость и безопасность инфраструктуры нашей платформы ИИ, создавая облачную пайплайн-развертку и обеспечивая бесперебойную работу наших сервисов по мере глобального масштабирования. Ожидайте динамичную работу с высокой степенью автономии, где ваша работа напрямую поддерживает производительность и рост продукта.
Ключевые обязанности
- Проектировать, развертывать и управлять кластерами Kubernetes для производственных нагрузок, обеспечивая высокую доступность и эффективное использование ресурсов
- Создавать и поддерживать CI/CD пайплайны с использованием GitHub Actions (или аналогичных), автоматизируя тестирование, сборку и развертывание
- Управлять и оптимизировать облачную инфраструктуру на AWS (EC2, EKS, ECR, S3, RDS, CloudFront) или эквивалентах GCP
- Контейнеризировать приложения с использованием Docker, поддерживать реестры образов и оптимизировать процессы сборки
- Реализовывать инфраструктуру как код с использованием Terraform, Pulumi или CloudFormation для обеспечения воспроизводимых и контролируемых версий окружений
- Мониторить состояние и производительность системы с использованием инструментов наблюдаемости (Prometheus, Grafana, Datadog или аналогичных), настраивая процессы оповещения и реагирования на инциденты
- Управлять и защищать базы данных PostgreSQL в производственной среде, включая резервное копирование, репликацию и восстановление после сбоев
- Укреплять безопасность инфраструктуры, управлять секретами, IAM-политиками, сегментацией сети и лучшими практиками соблюдения норм
- Тесно сотрудничать с бэкенд-инженерами для упрощения развертывания сервисов на Python (FastAPI/Django)
- Оптимизировать затраты на облачные ресурсы, правильно подбирая экземпляры и управляя зарезервированной мощностью
- Отвечать за реагирование на инциденты и процессы постмортем, способствуя улучшению надёжности платформы
- Поддерживать интеграцию и развертывание нагрузок ИИ/МЛ, обеспечивая эффективное выделение ресурсов GPU и вычислительных мощностей
Квалификации
- 3+ года профессионального опыта в DevOps, SRE или платформенной инженерии
- Подтверждённый опыт работы с Kubernetes в производственных средах, включая развертывание кластеров, оркестрацию подов, Helm charts, сервисные сети и устранение неполадок в масштабах
- Сильные навыки работы с Docker и оркестрацией контейнеров
- Солидный опыт работы с хотя бы одним крупным облачным провайдером (предпочтительно AWS, также принимается GCP)
- Умение работать с инструментами инфраструктуры как код (Terraform, Pulumi или CloudFormation)
- Опыт создания и поддержки CI/CD пайплайнов (GitHub Actions, GitLab CI, Jenkins или аналогичных)
- Знание стеков мониторинга и наблюдаемости (Prometheus, Grafana, Datadog, ELK и т.д.)
- Рабочие знания администрирования систем Linux и основ сетевого взаимодействия
- Опыт управления PostgreSQL или другими реляционными базами данных в производственной среде
- Понимание лучших практик безопасности
- Навыки скриптования на Python, Bash или Go для автоматизации задач
- Инициативный человек, который процветает в динамичной среде с высокой степенью ответственности и автономии
Будет плюсом
- Опыт развертывания и управления нагрузками ИИ/МЛ (выделение GPU, предоставление моделей)
- Знание Supabase, Firebase или аналогичных платформ BaaS
- Опыт работы с технологиями сервисных сетей (Istio, Linkerd)
- Вклад в открытые инфраструктуры или инструменты DevOps
- Профессиональные сертификаты AWS или GCP
Почему стоит работать в Qoves
- Решайте реальные проблемы, используя передовые технологии ИИ
- Хорошо финансируемый стартап с сообществом более 2,5 миллионов и сильной рыночной позицией
- Высокая степень автономии и ответственности за направление инфраструктуры
- Работайте напрямую с основателями в меритократической, ориентированной на миссию культуре
- Формируйте будущее целой индустрии на пересечении ИИ и эстетики