Site Reliability Engineer (SRE)
Компания Bright Vision Technologies ищет Senior SRE для поддержки и развития крупных распределенных систем. Вы будете отвечать за надежность, автоматизацию, мониторинг и управление инцидентами. Требуется опыт с Kubernetes, Python/Go, CI/CD и Linux. Предлагается удаленная работа на полный день с зарплатой $100K-$150K в год.
Эта вакансия платит больше рынка
На 158% выше медианы DevOps по 53 вакансиям за 90 дней.
Что предстоит делать
Штаб-квартира: Удаленно URL: http://bvteck.com Bright Vision Technologies — это прогрессивная компания по разработке программного обеспечения, стремящаяся создавать инновационные решения, которые помогают бизнесу автоматизировать и оптимизировать свои операции. Мы используем передовые технологии для создания масштабируемых, безопасных и удобных приложений. По мере нашего роста мы ищем квалифицированного инженера по надежности сайтов (SRE) для присоединения к нашей динамичной команде и внесения вклада в нашу миссию по трансформации бизнес-процессов с помощью технологий. Это отличная возможность присоединиться к устоявшейся и уважаемой организации, предлагающей огромный потенциал карьерного роста. Инженер по надежности сайтов (SRE) Должность: Инженер по надежности сайтов (SRE) Местоположение: 100% удаленно (континентальная часть США) Тип позиции: Внутренний проект Bright Vision Technologies по договору SOW (без участия сторонних клиентов или вендоров) Заработная плата: $100 000 – $150 000 в год Опыт: 5+ лет Спонсорство: Спонсорство новых виз H1B не предоставляется. Приветствуются переводы H1B для квалифицированных кандидатов. Тип занятости: Полная занятость, прямая ставка W2 с Bright Vision Technologies (без C2C, без 1099, без посредников) Занятость: Долгосрочная, многолетняя, согласованная с дорожной картой выполнения SOW Bright Vision. Компенсация: Конкурентная базовая заработная плата, соответствующая опыту, плюс льготы. Условия занятости и визовая политика Это 100% удаленная, полная занятость, прямая позиция W2 в компании Bright Vision Technologies. Эта роль является частью внутреннего проекта Bright Vision Technologies по договору SOW. Клиент, конечный заказчик и работодатель для этой позиции — Bright Vision Technologies. Сторонние клиенты, вендоры или партнеры по внедрению не участвуют. Мы не используем схемы C2C, 1099 или сторонние соглашения для этой роли. НО СТРОГО БЕЗ КОМПАНИЙ C2C/1099/3RD PARTY. ВСЕ НАШИ ВАКАНСИИ — W2, ПОЖАЛУЙСТА, НЕ ПРЕДЛАГАЙТЕ ПОСРЕДНИЧЕСКИЕ УСЛУГИ. Кандидаты должны быть готовы работать напрямую в качестве штатного сотрудника W2 компании Bright Vision Technologies и вносить вклад в наши внутренние результаты по SOW. Спонсорство новых виз H1B для этой роли не предоставляется. Однако кандидаты, которые в настоящее время имеют действительную визу H1B и нуждаются в переводе, могут подавать заявки. Мы поддержим перевод H1B для квалифицированных кандидатов. Для каждой роли обязательно прохождение технического оценочного задания по программированию. Пожалуйста, подавайте заявку только в том случае, если вы уверены в своих технических навыках и практическом опыте. Краткое описание вакансии Мы ищем опытного инженера по надежности сайтов для обеспечения доступности, производительности и операционного совершенства крупномасштабных распределенных систем в производственной среде. Как SRE, вы будете находиться на границе между разработкой и эксплуатацией, применяя сильные принципы программной инженерии к задачам инфраструктуры и эксплуатации, постоянно продвигая платформу к более высокой надежности с меньшими операционными трудозатратами. Идеальный кандидат сочетает глубокие знания систем с сильными навыками программирования, мышлением, основанным на измерениях, и дисциплиной для проектирования, автоматизации и эксплуатации сложных сервисов, чтобы надежность стала инженерным результатом первого класса, а не реактивной проблемой. Ключевые обязанности * Определять, внедрять инструментарий и постоянно совершенствовать цели уровня обслуживания (SLO), индикаторы уровня обслуживания (SLI) и бюджеты ошибок для критически важных сервисов, используя эти показатели для принятия конкретных инженерных решений и расстановки приоритетов. * Руководить реагированием на инциденты и их разрешением в случае производственных проблем, выступая в роли спокойного и эффективного руководителя инцидента при необходимости, и обеспечивая высококачественный посмертный анализ инцидентов, ведущий к долгосрочным улучшениям. * Проектировать и внедрять комплексные стратегии мониторинга, логирования и трассировки с использованием Prometheus, Grafana, OpenTelemetry, ELK/EFK, Datadog или аналогичных инструментов, чтобы операторы имели полную и действенную информацию о поведении системы. * Создавать и поддерживать надежные процессы дежурств, инструкции (runbooks) и пути эскалации, которые сокращают среднее время обнаружения и среднее время устранения неисправностей, одновременно защищая благополучие инженеров, находящихся на дежурстве. * Активно автоматизировать операционные рутинные задачи, создавая инструменты производственного уровня на Python, Go, Bash или аналогичных языках, заменяя ручные рабочие процессы надежной, проверяемой автоматизацией. * Проектировать и эксплуатировать крупномасштабные кластеры Kubernetes и рабочие нагрузки на основе контейнеров, включая автоматическое масштабирование, планирование мощностей, сетевые политики и интеграцию с сервисными сетками. * Проектировать CI/CD пайплайны, обеспечивающие безопасные, частые и наблюдаемые релизы, поддерживаемые автоматическим тестированием, канареечными развертываниями, функциональными флагами и стратегиями постепенного развертывания. * Руководить деятельностью по планированию мощностей и инженерии производительности, создавая модели, прогнозирующие рост и нагрузку, и проверяя эти модели с помощью нагрузочного тестирования и хаос-экспериментов. * Тесно сотрудничать с командами разработки приложений, чтобы внедрять практики надежности на ранних этапах проектирования, включая анализ режимов отказов, шаблоны корректной деградации и повышение устойчивости зависимостей. * Укреплять устойчивость платформы с помощью хаос-инжиниринга, внедрения отказов, изоляции зависимостей, повторных попыток, таймаутов, автоматических выключателей (circuit breakers) и хорошо протестированных путей переключения при сбое. * Обеспечивать непрерывное улучшение состояния безопасности в сотрудничестве с командами безопасности, включая управление исправлениями, устранение уязвимостей и настройки платформы по умолчанию, безопасные по своей сути. * Вносить вклад в техническую дорожную карту для инструментов надежности, платформ наблюдаемости и улучшений опыта разработчиков, которые снижают трения и улучшают результаты для инженерных команд. * Наставлять инженеров по всей организации в отношении практик SRE и способствовать созданию сильной, безобвинительной культуры операционного совершенства. Требуемая квалификация * Степень бакалавра в области компьютерных наук, инженерии или смежной технической дисциплины. * Пять или более лет опыта работы в качестве SRE, DevOps или производственного инженера, поддерживающего крупномасштабные распределенные системы. * Сильные навыки программирования как минимум на одном из языков: Python, Go или Java, со способностью создавать надежную автоматизацию и инструменты. * Глубокий практический опыт эксплуатации Linux в масштабе, включая работу с сетями, настройку производительности и устранение неисправностей на уровне системы. * Производственный опыт эксплуатации Kubernetes и контейнерных рабочих нагрузок. * Хорошее практическое знание инструментов наблюдаемости, таких как Prometheus, Grafana, OpenTelemetry, ELK/EFK или их коммерческих аналогов. * Практический опыт проектирования и эксплуатации CI/CD пайплайнов как для инфраструктуры, так и для приложений. * Твердое понимание проектирования распределенных систем, включая модели согласованности, секционирование и семантику отказов. * Подтвержденный опыт руководства реагированием на инциденты и проведения эффективных посмертных анализов. * Отличные коммуникативные навыки и навыки документирования. Предпочтительная квалификация * Опыт определения и внедрения SLO и бюджетов ошибок в реальных производственных средах. * Опыт работы с практиками и инструментами хаос-инжиниринга, такими как Chaos Monkey, Gremlin или Litmus. * Практический опыт работы как минимум с одной крупной облачной платформой (AWS, Azure или GCP). * Опыт в планировании мощностей, инженерии производительности или крупномасштабном нагрузочном тестировании. * Знакомство с технологиями сервисных сеток, такими как Istio, Linkerd или Consul. Как подать заявку Хотите узнать больше об этой возможности? Для оперативного рассмотрения, пожалуйста, отправьте свое резюме на [email protected] или свяжитесь с нами по телефону (908) 505-3899. Узнайте больше о Bright Vision Technologies на www.bvteck.com. Мы признаем, что наши сотрудники — наша сила, и разнообразные таланты, которые они привносят в нашу глобальную команду, напрямую связаны с нашим успехом. Мы являемся работодателем, предоставляющим равные возможности, и придаем большое значение разнообразию и инклюзивности в нашей компании. Мы не дискриминируем по признаку любой защищенной характеристики, включая расу, религию, цвет кожи, национальное происхождение, пол, сексуальную ориентацию, гендерную идентичность, гендерное выражение, возраст, семейное положение или статус ветерана, беременность или инвалидность, или любые другие признаки, защищенные применимым законодательством. Мы также предоставляем разумные приспособления для религиозных обрядов и убеждений соискателей и сотрудников, а также для потребностей, связанных с психическим здоровьем или физическими ограничениями. Bright Vision Technologies — это работодатель, предоставляющий равные возможности, включая инвалидов и ветеранов. Должность предлагается «Агентством без комиссии». Заявление о равных возможностях трудоустройства (EEO) Bright Vision Technologies (BV Teck) стремится к обеспечению равных возможностей трудоустройства (EEO) для всех сотрудников и соискателей без учета расы, цвета кожи, религии, пола, сексуальной ориентации, гендерной идентичности или выражения, национального происхождения, возраста, генетической информации, инвалидности, статуса ветерана или любого другого защищенного статуса, как это определено применимым федеральным, государственным или местным законодательством. Это обязательство распространяется на все аспекты трудовых отношений, включая подбор персонала, найм, обучение, оплату труда, продвижение по службе, перевод, отпуска, увольнение, сокращение штата и повторный прием на работу. BV Teck категорически запрещает любые формы домогательств или дискриминации на рабочем месте. Любое неправомерное вмешательство в способность сотрудников выполнять свои должностные обязанности может повлечь за собой дисциплинарные меры вплоть до увольнения. Для подачи заявки: https://weworkremotely.com/remote-jobs/bright-vision-technologies-site-reliability-engineer-sre
Стек и инструменты
Подходит ли вам эта вакансия?
Зарегистрируйтесь и загрузите резюме — посчитаем % совпадения с этой вакансией, подсветим сильные стороны и что стоит подтянуть
Похожие вакансии
6 вакансий
Старший DevOps инженер
Международная продуктовая компания ищет Senior DevOps Engineer для работы с высоконагруженными платформами. Вы будете проектировать и поддерживать инфраструктуру, автоматизировать процессы, работать с Linux, CI/CD, мониторингом и сетями. Требуется 5+ лет опыта и глубокие знания DevOps-инструментов. Предлагается удаленная работа и участие в сложных инфраструктурных проектах.
Инженер по автоматизации (Инфраструктура и DevOps)
~3 155 838 ₸ оценка
Ищем опытного DevOps-инженера для автоматизации инфраструктуры в проекте по солнечной энергетике. Требуются глубокие знания Terraform и Ansible, опыт с виртуализацией и CI/CD. Предлагаем удаленную работу в американском часовом поясе и участие в масштабном проекте.
DevOps-инженер / Системный администратор
~3 155 838 ₸ оценка
Ищем опытного DevOps-инженера для сопровождения и развития инфраструктуры на базе Proxmox VE и Ceph. Требуется глубокое знание Linux, автоматизации (Ansible, Terraform) и мониторинга. Предлагаем удаленную работу, официальное трудоустройство и ДМС.
Старший DevOps инженер
~1 216 175 ₸ оценка
Ciklum ищет опытного DevOps инженера для работы над заменой устаревшей платформы на современную систему на Azure. Требуется глубокое знание облачных технологий, контейнеризации и автоматизации. Компания предлагает удаленную работу, гибкий график и возможности для профессионального роста.
Azure DevOps и .NET инженер
~1 216 175 ₸ оценка
Ищем опытного Azure DevOps и .NET инженера для стабилизации и развития ресторанной платформы. Вы будете отвечать за производительность, релизы, инциденты и обновление системы на стеке .NET/C#, Azure и SQL Server. Требуется глубокое знание Azure, DBA-навыки и готовность к ночным релизам. Предлагаем удаленную работу или офис в Киеве, медстраховку и дружную команду.
DBA (Администратор баз данных)
~3 155 838 ₸ оценка
Команда финтеха Wildberries ищет опытного DBA для поддержки и развития высоконагруженных баз данных. Вы будете отвечать за отказоустойчивость, мониторинг и оптимизацию PostgreSQL и ClickHouse, автоматизировать миграции и участвовать в архитектурных обсуждениях. Предлагается гибридный или удаленный формат работы.