Старший инженер по надежности баз данных
Ищем опытного инженера для поддержки и развития баз данных (PostgreSQL, ClickHouse, MongoDB, Redis) в продуктовой компании. Нужно обеспечивать надежность, автоматизировать рутину и помогать командам разработки. Предлагаем полную удаленку, гибкий график и соцпакет.
Зарплата не указана — оценили по рынку
На основе 246 похожих вакансий за 90 дней.
Что предстоит делать
CloudLinux / TuxCare — это инфраструктурная компания в сфере безопасности, работающая в формате remote-first. Более 300 инженеров разрабатывают и поддерживают продукты, используемые хостинг-провайдерами, предприятиями и внутренними сервисными командами по всему миру. Наш инфраструктурный отдел управляет платформами, лежащими в основе CloudLinux OS, Imunify, KernelCare, TuxCare ELS, а также нашими инженерными системами. Мы нанимаем старшего инженера по надежности баз данных (Senior Database Reliability Engineer) в ячейку Infrastructure DBA. Это практическая роль с ответственностью за продакшн, а не узкая позиция по обработке тикетов DBA. Вы будете обеспечивать надежность критически важных сервисов баз данных, автоматизировать повторяющуюся работу, поддерживать инженерные команды и снижать зависимость от одного человека в операциях с PostgreSQL, ClickHouse, MongoDB и Redis. PostgreSQL является основным требованием. Опыт работы с ClickHouse — это большой плюс, но не является блокирующим фактором с первого дня. Нам нужен старший инженер с достаточной глубиной знаний в области баз данных, Linux, автоматизации и реагирования на инциденты, чтобы быстро изучить нашу среду ClickHouse и безопасно с ней работать. **Ваши обязанности:** - Обеспечение надежности PostgreSQL в продакшне: проектирование HA, Patroni, PgBouncer, репликация, failover, обновления, контроль вакуума/bloat, настройка запросов, блокировки, индексы, емкость, резервное копирование, PITR и проверка восстановления. - Улучшение аварийного восстановления и операционной доказательности: проверенные восстановления, документированные пути восстановления, измеримые цели RTO/RPO, runbook'и и безопасные планы обслуживания. - Поддержка более широкого парка баз данных: ClickHouse, MongoDB и Redis. Вы будете устранять инциденты, проверять изменения доступа и безопасности данных, улучшать мониторинг и изучать уже используемые паттерны работы с ClickHouse в продакшне. - Автоматизация рабочих процессов DBA с помощью Ansible, Terraform/OpenTofu, GitLab CI/CD, скриптов и воспроизводимых runbook'ов для предоставления доступа, грантов, резервного копирования, восстановления, проверок работоспособности и метаданных владения. - Помощь в создании возможностей самообслуживания в стиле DBaaS, чтобы инженерные команды могли запрашивать базы данных, доступ, учетные данные и операционные проверки с меньшим ручным вмешательством DBA. - Улучшение наблюдаемости и реагирования на инциденты с помощью Grafana, метрик, логов, SLO, правил оповещения, маршрутизации Opsgenie и четкой коммуникации во время проблем в продакшне. **Как выглядит успех:** - Кластеры PostgreSQL имеют проверенные пути резервного копирования и восстановления, полезные дашборды, четкое владение и документированные процедуры failover. - Повторяющиеся тикеты DBA превращаются в автоматизацию или рабочие процессы самообслуживания. - Операционные знания ClickHouse больше не являются зависимостью от одного человека. - Инциденты с базами данных имеют владельцев, runbook'и, доказательства и измеримые пути восстановления. - Команды разработчиков продуктов и инженерные команды получают помощь с базами данных быстрее, без ущерба для безопасности, аудита или надежности. **Почему CloudLinux?** Вы будете работать с реальной продакшн-инфраструктурой, используемой в продуктах CloudLinux и TuxCare. Вы будете напрямую влиять на надежность, реагирование на инциденты, опыт разработчиков и операционную устойчивость. Вы также будете работать в инженерной культуре с поддержкой AI, где автоматизация, документация, Claude, Codex и тщательная человеческая проверка являются частью ежедневной рабочей модели. **Что мы ожидаем от вас:** - Глубокий практический опыт работы с PostgreSQL в критически важных для бизнеса продакшн-средах, обычно 5+ лет или эквивалентная глубина знаний. - Сильное понимание внутреннего устройства и операций PostgreSQL: MVCC, WAL, транзакции, блокировки, индексы, планирование запросов, репликация, autovacuum, bloat, крупные обновления, резервное копирование, PITR и тестирование восстановления. - Подтвержденный опыт работы с высокодоступными базами данных и способность рассуждать о кворуме, риске split-brain, failover, откате и восстановлении. - Хорошие знания Linux и основ инфраструктуры: systemd, сети, хранилища, файловые системы, узкие места CPU/память/диск, TLS, DNS, межсетевые экраны и устранение первопричин. - Навыки автоматизации с Ansible и написания скриптов. Terraform/OpenTofu, GitLab CI/CD и доставка на основе merge request являются большими преимуществами. - Способность поддерживать более одного движка баз данных. Вам не нужно быть экспертом по ClickHouse с первого дня, но вы должны быть готовы быстро его изучить и взять на себя ответственность за него. - Практическое использование AI-ассистентов для инженеров, таких как Claude и Codex. Мы ожидаем, что вы будете использовать их для повышения скорости и качества, при этом лично проверяя сгенерированный SQL, команды, скрипты и операционные выводы. - Четкий письменный английский для асинхронной работы в Jira, Slack, GitLab, Slite и runbook'ах. **Желательно, но не обязательно:** - Операции с ClickHouse: репликация, Keeper/ZooKeeper, движки MergeTree, распределенный DDL, гранты, политики строк, резервное копирование, устранение неполадок запросов и восстановление кластера. - Реплика-сеты MongoDB и Percona Backup for MongoDB. - Redis/Sentinel и режимы отказа брокеров/кэшей. - Наблюдаемость баз данных, SLO, золотые сигналы, настройка оповещений и исполняемые runbook'и для инцидентов. - Создание внутренних платформ, порталов самообслуживания или рабочих процессов DBaaS для инженерных команд. **Что мы предлагаем:** - Фокус на профессиональном развитии. - Интересные и сложные проекты. - Полностью удаленная работа с гибким графиком, что позволяет вам планировать свой день и работать из любой точки мира. - 24 оплачиваемых дня отпуска в год, 10 дней государственных праздников и неограниченное количество больничных. - Компенсация расходов на частную медицинскую страховку. - Компенсация коворкинга и абонементов в спортзал/спорт. - Бюджет на образование. - Возможность получить вознаграждение за самую инновационную идею, которую компания может запатентовать. Подавая заявку на эту должность, вы соглашаетесь с Политикой конфиденциальности CloudLinux и даете нам согласие на хранение и обработку ваших персональных данных в связи с этим. Пожалуйста, прочитайте нашу Политику конфиденциальности для получения дополнительной информации. Пожалуйста, укажите слово **UNDERSTANDABLE** и тег ROjox при подаче заявки, чтобы показать, что вы полностью прочитали описание вакансии (#ROjox). Это бета-функция для избежания спама от соискателей. Компании могут искать эти слова, чтобы найти соискателей, которые прочитали это, и убедиться, что они люди.
Стек и инструменты
Подходит ли вам эта вакансия?
Зарегистрируйтесь и загрузите резюме — посчитаем % совпадения с этой вакансией, подсветим сильные стороны и что стоит подтянуть
Похожие вакансии
6 вакансийDevOps инженер
Ищем опытного DevOps инженера для поддержки и развития инфраструктуры e-commerce платформы. Требуется 5+ лет опыта, знание AWS, Kubernetes и CI/CD. Предлагаем удаленную работу и сотрудничество с международной командой.
DevOps инженер (Kubernetes, AWS, TypeScript)
~658 436 – 1 224 202 ₸ оценка
Ищем опытного DevOps-инженера для работы с инфраструктурой на AWS и Kubernetes. Нужно управлять CI/CD, мониторингом и инцидентами, а также иногда писать на TypeScript. Предлагают полную удалёнку, гибкий график и работу в небольшой команде над реальным продуктом.
DevOps инженер (Cloud / SRE)
~658 436 – 1 224 202 ₸ оценка
Ищем опытного DevOps инженера для управления облачной инфраструктурой (GCP, AWS, Alibaba Cloud), CI/CD и обеспечения надежности в стартапе. Требуется опыт с Terraform, контейнерами и самостоятельное решение проблем. Предлагаем гибкий формат работы, удаленку и интересные задачи.
Системный администратор 1С
~1 326 000 – 1 989 000 ₸ оценка
Ищем опытного администратора 1С для поддержки высоконагруженной инфраструктуры. Требуется глубокое знание платформы 1С 8.3, PostgreSQL и инструментов мониторинга. Предлагаем гибридный или удаленный формат, ДМС и 31 день отпуска.
DevOps / SRE инженер (Python/Go)
~1 326 000 – 1 989 000 ₸ оценка
X5 Tech ищет опытного DevOps/SRE инженера для работы с высоконагруженными системами мониторинга и автоматизации. Требуется уверенное знание Linux, Python/Go, опыт с Grafana, Prometheus/Victoria, Docker и Kubernetes. Компания предлагает удаленную работу или офис в Москве, ДМС, обучение и корпоративные бонусы.
Senior Microsoft Cloud Engineer
~658 436 – 1 224 202 ₸ оценка
Шукаємо Senior Microsoft Cloud Engineer для підтримки та розвитку корпоративної Microsoft-екосистеми. Потрібен досвід адміністрування Microsoft 365, Intune, Entra ID та Azure, впевнене володіння PowerShell. Пропонуємо віддалену роботу, бонуси, навчання, страхування та wellbeing-програму.