Site Reliability Engineer (SRE)
Galaktica ищет первого Site Reliability Engineer для построения культуры надежности. Вы будете определять SLI/SLO, развивать observability, управлять инцидентами и анализировать production-код. Требуется 5+ лет опыта с распределенными системами и 2+ года в SRE. Предлагают удаленную работу, медстраховку, обучение и гибкий график.
Эта вакансия платит больше рынка
На 24% выше медианы DevOps по 33 вакансиям за 90 дней.
Что предстоит делать
Galaktica — украинская продуктовая IT-компания, которая с 2019 года создает мобильные приложения и веб-продукты для рынков Tier-1. В команде 350+ специалистов с ведущей экспертизой, работающих из разных уголков мира. Мы развиваем международные продукты, экспериментируем с подходами и быстро масштабируем решения, улучшающие жизнь миллионов пользователей. Важной составляющей бизнеса Galaktica является благотворительность. С 2022 года мы направили большое количество волонтерской помощи в разные направления. В первую очередь, поддержка ВСУ: десятки внедорожников и коммерческих квадрокоптеров, сотни FPV-дронов, НРК с турелями, квадроциклы. Также развиваем два благотворительных фонда: фокус на реабилитации военных и на поддержке детей военнослужащих и пострадавших от войны. О роли: Мы ищем первого Site Reliability Engineer, который заложит фундамент культуры надежности в компании. По мере роста продуктов и команд растут и требования к стабильности систем, поэтому нам нужен человек, который будет проводить глубокий анализ инцидентов, находить системные причины проблем и помогать строить процессы и практики, повышающие надежность наших сервисов. На данной должности вам необходимо будет решить следующие задачи: - Определить и поддерживать SLI/SLO для критических продуктовых сервисов. - Построить regular reliability reporting. - Создать и развивать observability-стратегию в компании. - Выстроить способность команд владеть надежностью своих сервисов и продуктов. - Выступать incident commander для критических cross-service инцидентов. - Внедрить глубокий разбор сложных причинно-следственных связей между сервисами и командами при решении проблем. - Создавать runbooks для типовых инцидентов. Какие навыки и критерии нам сейчас важны: - 5+ лет опыта работы с production distributed systems, из них 2+ года в явной SRE-роли или эквивалентной позиции с SRE-обязанностями. - Практический опыт внедрения SLO/SLI. - Глубокая экспертиза в observability на уровне проектирования. - Практический опыт поддержки процессов Incident management в роли incident commander, ведение blameless postmortems в качестве фасилитатора. - Опыт дебага распределенных production систем в среде AWS/Kubernetes. - Способность читать и анализировать production-код сервисов для поиска корневых причин инцидентов. - Экспертиза в реляционных БД под нагрузкой. - Умение анализировать production-код (Node JS/PHP) для поиска корневых причин инцидентов. Будет плюсом: - Опыт первого SRE в компании или построения SRE-практик с ранней стадии. - Опыт сложных production-миграций с сохранением доступности. Что мы рады вам предложить: - Формат работы: выбирайте, как вам удобнее — удаленно, гибридно или в офисе в Киеве, Львове, Одессе или на Кипре (Ларнака). Все украинские офисы оборудованы генераторами со Starlink и доступны для команды 24/7. Рабочий график — с 10:00 до 18:30; - Оборудование: предоставляем все необходимое для комфортной работы и для решения масштабных задач, экспериментов — ноутбук/ПК/дополнительные мониторы или специализированные гаджеты; - Безопасность и страховка: мы не только следим за уровнем удовлетворенности сотрудников, но и заботимся о вас в трудные моменты. Каждый сотрудник имеет медицинское страхование за счет компании (на территории Украины) или денежную компенсацию на спорт; - Отдых и баланс: 3 недели оплачиваемого отпуска ежегодно, неограниченные day off и гибкие sick leaves без лишней бюрократии. Мы доверяем команде, поэтому поддерживаем здоровый баланс между работой и личной жизнью; - Коллеги и атмосфера: люди, которые вас окружают, определяют уровень жизни и развитие. Благодаря качественным этапам собеседования, мы подбираем лучших из лучших. Вы будете работать с настоящими профессионалами в своей сфере; - Непрерывное развитие: оплачиваем тренинги, семинары, онлайн-курсы, конференции. Имеем собственную LMS-систему, библиотеку и книжный клуб, которые объединяют тех, кто не останавливается в обучении. Кроме того, у нас есть 3 сертифицированных коуча, которые проводят внутренние обучения и персональные коуч-сессии для сотрудников — это помогает лучше понимать себя, прокачивать лидерские навыки и достигать профессиональных целей; - Английский язык: выделяем бюджет на индивидуальные занятия и имеем Speaking Club, чтобы вы прокачали свой английский язык и забыли о любых барьерах; - Спортивные активности: присоединяйтесь к корпоративным тренировкам по волейболу, бегу или йоге еженедельно, которые полностью оплачивает компания. Мы уже пробежали не один марафон, ведь наши тренеры — настоящие профессионалы; - Командный дух: мы регулярно проводим тимбилдинги от выездных до уютных встреч в офисе. Это отличный шанс познакомиться поближе и зарядиться энергией команды. Атмосферу наших ивентов можно почувствовать здесь — YouTube Galaktica. 🚀 Наша цель Построить продуктовую IT экосистему разных направлений, в которой каждый сотрудник будет иметь возможность открывать внутренние стартапы, расти и реализовывать свои идеи. Присоединяйтесь! Будем рады обсудить все ваши вопросы и пригласить вас на собеседование! Подчеркиваем, мы свяжемся с вами любым удобным способом для детального обсуждения нашей вакансии в случае заинтересованности команды в вашей кандидатуре!
Стек и инструменты
Подходит ли вам эта вакансия?
Зарегистрируйтесь и загрузите резюме — посчитаем % совпадения с этой вакансией, подсветим сильные стороны и что стоит подтянуть
Похожие вакансии
6 вакансийSenior Linux Infrastructure Engineer
Ищем опытного инженера для управления и автоматизации инфраструктуры из 2000 серверов на Linux. Нужно работать с Ansible, VPN-стеком и взаимодействовать с дата-центрами. Требуются глубокие знания Linux и самостоятельность.
Старший инженер технологической инфраструктуры
Ищем старшего инженера для работы с технологической инфраструктурой. Требуется опыт работы с Ceph, Kubernetes и HashiCorp. Предлагается удаленная работа.
DevOps инженер — построение AI-first CI/CD пайплайна (проектная работа)
~2 890 030 – 3 951 948 ₸ оценка
Ищем DevOps-инженера для проектной работы по построению современного AI-first CI/CD пайплайна. Нужно спроектировать и реализовать полный цикл от изолированной песочницы для AI-агента до деплоя на production с canary-стратегией и observability. Требуется опыт с CI/CD, Docker, Terraform, PostgreSQL, Redis и мониторингом. Работа полностью удаленная, оплата фиксированная или поэтапная.
Старший Cloud Engineer
Ищем опытного Cloud Engineer для работы с Python и Azure. Вы будете заниматься облачной инфраструктурой и автоматизацией. Предлагается удаленный формат работы.
Системный администратор / DevOps инженер
~813 600 – 1 627 200 ₸ оценка
Ищем опытного системного администратора для поддержки серверной инфраструктуры на Linux и Windows. Нужно уверенное знание Linux, опыт с VMware, PostgreSQL, Docker и сетевым оборудованием. Предлагаем удаленную работу, полный день и соцпакет.
Инженер DevOps
Ищем DevOps-инженера для поддержки и развития инфраструктуры. В задачи входит автоматизация с помощью Terraform, Ansible, Helm и Gitlab-ci, а также мониторинг и обеспечение отказоустойчивости сервисов. Требуется опыт работы с кластерами и реагирования на инциденты.