18 3 мес. назад

Технический лидер SRE

Ищем Lead SRE для управления надежностью сервисов и оптимизации их производительности. Важны навыки в SRE-практиках, опыт работы с Kubernetes и Linux, а также умение проводить code review и менторить команды.

lead
Опубликовано
29 ноября 2025
Вакансии в Telegram-канале
Свежие вакансии Каждый день
Подписаться
??%
Match Score
Войдите и создайте резюме
Войти

описание

Навыки: SQL. Квалификация: Lead. Специализации: Разработчик приложений. **Чем предстоит заниматься:** - управление надежностью сервисов: проектирование, внедрение и поддержка SLO/SLI, error budget, координация процесса соблюдения SLO, управление использованием Error Budget; - мониторинг и алертинг: разработка метрик, алертов, дашбордов, ранбуков (и их регулярный анализ/рефакторинг); - capacity planning: прогнозирование нагрузки и планирование ресурсов; - performance optimization: выявление и устранение bottleneck, оптимизация производительности; - incident & problem management: участие в устранении инцидентов (роль Incident Commander), расследование причин (RCA); ревью postmortems, разработка и внедрение corrective actions, при необходимости - заведение проблем и контроль их решения; - повышение отказоустойчивости: улучшение observability (логи, трейсы, метрики: обогащение, добавление, ревизия...); - ревью DRP, участие в качестве координатора в DRT, поддержание DRP в актуальном состоянии; автоматизация: устранение рутины - IaC (Terraform/Ansible) и Python/Go/Bash; - менторство и обучение: проведение внутренних воркшопов для команд разработки по темам надёжности, observability, помощь в развитии навыков SRE у других инженеров, code review внутри команды; - активное участие в разработке модели здоровья продукта и quality gates. **Что мы ждем от кандидата:** - экспертиза и практический опыт в SRE-практиках: глубокое понимание SLO/SLI, error budget, toil reduction, automation first... умение применять это практически для обеспечения надежности сервисов; - умение проводить code review для оценки готовности к выходу в production новых функций и сервисов с точки зрения надёжности, наблюдаемости и эффективности, понимание, как изменения в коде влияют на смежные системы и общую стабильность платформы; - практический опыт построения и внедрения quality gates в CI/CD процесс для управления рисками при развертывании: для предотвращения попадания нестабильных изменений в production; - эксперт в эксплуатации Linux, включая диагностику на уровне ядра (процессы, память, сеть); глубокие знания и понимание того, как работают сети на уровнях L2-L7; - опыт работы с Kubernetes и понимание его internal'ов для диагностики сложных проблем. Дополнительно: - системное мышление и умение анализировать сложные failure-сценарии, выявлять корневые причины, находить способы их устранения; - опыт написания и ревью технической документации (runbooks, postmortems...); - опыт коммуникации с разработчиками и бизнесом (объяснение trade-offs между reliability и feature dev).

Похожие вакансии

6 вакансии
АО «НЦГНТЭ»
АО «НЦГНТЭ»
2 д. назад

Начальник управления системного администрирование Департамента информационных технологий

450 000 - 450 000 KZT

Ищем старшего DevOps-инженера для работы в АО «НЦГНТЭ». Вам предстоит заниматься архитектурой серверов, автоматизацией процессов и обеспечением безопасности. Требуется опыт работы в IT не менее 3-5 лет и знание Linux, виртуализации и сетевого администрирования.

Инициативность · Исполнительность · Качественное выполнение функциональных обязанностей ·+1

senior Алматы
Телекомпания ЭРА
Телекомпания ЭРА
2 д. назад

Системный администратор/инженер систем автоматизации

300 000 - 350 000 KZT

Ищем опытного специалиста по администрированию сетей с опытом работы от 5 лет. Ваша задача будет заключаться в обеспечении работоспособности ЛВС и коммуникационного оборудования, а также в администрировании ОС и систем виртуализации.

Администрирование серверов Windows · Linux · Zabbix ·+9

senior Астана
Uplab
Uplab
2 д. назад

Руководитель IT отдела

В Uplab вам предстоит управлять командой и развивать ИТ-подразделение, занимаясь инфраструктурным сопровождением и внедрением современных практик. Мы предлагаем интересные проекты и возможность профессионального роста в надежной компании.

Администрирование серверов Linux · CI/CD · Аналитическое мышление ·+4

lead удал.
MANGO OFFICE
MANGO OFFICE
4 д. назад

Ведущий администратор Linux

MANGO OFFICE ищет ведущего администратора Linux с опытом работы от 5 лет. Ваша задача будет заключаться в поддержке и развитии инфраструктуры, а также автоматизации процессов. Компания предлагает удаленную работу, гибкий график и возможности для карьерного роста.

Ansible · Docker

lead удал.
МТС Web Services
МТС Web Services
1 нед. назад

Руководитель команды виртуализации

Присоединяйтесь к команде МТС Web Services и возглавьте разработку облачной платформы. Вам предстоит управлять командой, контролировать процессы виртуализации и внедрять новые технологии. Мы предлагаем гибкий график, возможность удаленной работы и множество социальных льгот.

VMware · vSphere · NAS ·+1

lead удал.
B
BInTech
2 д. назад

Системный администратор

Вакансия для системного администратора, который будет заниматься настройкой и сопровождением компьютерной техники, обеспечением безопасности и техническим сопровождением информационных систем. Ищем кандидата с практическим опытом и навыками работы с различными операционными системами.

middle Алматы