4 д. назад

Site Reliability Engineer (SRE)

Компания Bright Vision Technologies ищет Senior SRE для поддержки и развития крупных распределенных систем. Вы будете отвечать за надежность, автоматизацию, мониторинг и управление инцидентами. Требуется опыт с Kubernetes, Python/Go, CI/CD и Linux. Предлагается удаленная работа на полный день с зарплатой $100K-$150K в год.

senior удалённо ~4 053 755 – 6 080 875 ₸ (8 333 – 12 500 USD)

Войти и откликнуться WWR

Языки: English · Pre-Intermediate

salary intelligence

Эта вакансия платит больше рынка

На 158% выше медианы DevOps по 53 вакансиям за 90 дней.

эта

5 067 072 ₸

медиана

1 702 645 ₸

p25–p75

701 490 – 2 432 350 ₸

Хотите увидеть распределение по грейдам и городам? Зарплаты DevOps Калькулятор зарплат

Вакансии в Telegram-канале

Свежие вакансии Каждый день

??%

Match Score

Войдите и создайте резюме

Войти

описание

Что предстоит делать

Штаб-квартира: Удаленно URL: http://bvteck.com Bright Vision Technologies — это прогрессивная компания по разработке программного обеспечения, стремящаяся создавать инновационные решения, которые помогают бизнесу автоматизировать и оптимизировать свои операции. Мы используем передовые технологии для создания масштабируемых, безопасных и удобных приложений. По мере нашего роста мы ищем квалифицированного инженера по надежности сайтов (SRE) для присоединения к нашей динамичной команде и внесения вклада в нашу миссию по трансформации бизнес-процессов с помощью технологий. Это отличная возможность присоединиться к устоявшейся и уважаемой организации, предлагающей огромный потенциал карьерного роста. Инженер по надежности сайтов (SRE) Должность: Инженер по надежности сайтов (SRE) Местоположение: 100% удаленно (континентальная часть США) Тип позиции: Внутренний проект Bright Vision Technologies по договору SOW (без участия сторонних клиентов или вендоров) Заработная плата: $100 000 – $150 000 в год Опыт: 5+ лет Спонсорство: Спонсорство новых виз H1B не предоставляется. Приветствуются переводы H1B для квалифицированных кандидатов. Тип занятости: Полная занятость, прямая ставка W2 с Bright Vision Technologies (без C2C, без 1099, без посредников) Занятость: Долгосрочная, многолетняя, согласованная с дорожной картой выполнения SOW Bright Vision. Компенсация: Конкурентная базовая заработная плата, соответствующая опыту, плюс льготы. Условия занятости и визовая политика Это 100% удаленная, полная занятость, прямая позиция W2 в компании Bright Vision Technologies. Эта роль является частью внутреннего проекта Bright Vision Technologies по договору SOW. Клиент, конечный заказчик и работодатель для этой позиции — Bright Vision Technologies. Сторонние клиенты, вендоры или партнеры по внедрению не участвуют. Мы не используем схемы C2C, 1099 или сторонние соглашения для этой роли. НО СТРОГО БЕЗ КОМПАНИЙ C2C/1099/3RD PARTY. ВСЕ НАШИ ВАКАНСИИ — W2, ПОЖАЛУЙСТА, НЕ ПРЕДЛАГАЙТЕ ПОСРЕДНИЧЕСКИЕ УСЛУГИ. Кандидаты должны быть готовы работать напрямую в качестве штатного сотрудника W2 компании Bright Vision Technologies и вносить вклад в наши внутренние результаты по SOW. Спонсорство новых виз H1B для этой роли не предоставляется. Однако кандидаты, которые в настоящее время имеют действительную визу H1B и нуждаются в переводе, могут подавать заявки. Мы поддержим перевод H1B для квалифицированных кандидатов. Для каждой роли обязательно прохождение технического оценочного задания по программированию. Пожалуйста, подавайте заявку только в том случае, если вы уверены в своих технических навыках и практическом опыте. Краткое описание вакансии Мы ищем опытного инженера по надежности сайтов для обеспечения доступности, производительности и операционного совершенства крупномасштабных распределенных систем в производственной среде. Как SRE, вы будете находиться на границе между разработкой и эксплуатацией, применяя сильные принципы программной инженерии к задачам инфраструктуры и эксплуатации, постоянно продвигая платформу к более высокой надежности с меньшими операционными трудозатратами. Идеальный кандидат сочетает глубокие знания систем с сильными навыками программирования, мышлением, основанным на измерениях, и дисциплиной для проектирования, автоматизации и эксплуатации сложных сервисов, чтобы надежность стала инженерным результатом первого класса, а не реактивной проблемой. Ключевые обязанности * Определять, внедрять инструментарий и постоянно совершенствовать цели уровня обслуживания (SLO), индикаторы уровня обслуживания (SLI) и бюджеты ошибок для критически важных сервисов, используя эти показатели для принятия конкретных инженерных решений и расстановки приоритетов. * Руководить реагированием на инциденты и их разрешением в случае производственных проблем, выступая в роли спокойного и эффективного руководителя инцидента при необходимости, и обеспечивая высококачественный посмертный анализ инцидентов, ведущий к долгосрочным улучшениям. * Проектировать и внедрять комплексные стратегии мониторинга, логирования и трассировки с использованием Prometheus, Grafana, OpenTelemetry, ELK/EFK, Datadog или аналогичных инструментов, чтобы операторы имели полную и действенную информацию о поведении системы. * Создавать и поддерживать надежные процессы дежурств, инструкции (runbooks) и пути эскалации, которые сокращают среднее время обнаружения и среднее время устранения неисправностей, одновременно защищая благополучие инженеров, находящихся на дежурстве. * Активно автоматизировать операционные рутинные задачи, создавая инструменты производственного уровня на Python, Go, Bash или аналогичных языках, заменяя ручные рабочие процессы надежной, проверяемой автоматизацией. * Проектировать и эксплуатировать крупномасштабные кластеры Kubernetes и рабочие нагрузки на основе контейнеров, включая автоматическое масштабирование, планирование мощностей, сетевые политики и интеграцию с сервисными сетками. * Проектировать CI/CD пайплайны, обеспечивающие безопасные, частые и наблюдаемые релизы, поддерживаемые автоматическим тестированием, канареечными развертываниями, функциональными флагами и стратегиями постепенного развертывания. * Руководить деятельностью по планированию мощностей и инженерии производительности, создавая модели, прогнозирующие рост и нагрузку, и проверяя эти модели с помощью нагрузочного тестирования и хаос-экспериментов. * Тесно сотрудничать с командами разработки приложений, чтобы внедрять практики надежности на ранних этапах проектирования, включая анализ режимов отказов, шаблоны корректной деградации и повышение устойчивости зависимостей. * Укреплять устойчивость платформы с помощью хаос-инжиниринга, внедрения отказов, изоляции зависимостей, повторных попыток, таймаутов, автоматических выключателей (circuit breakers) и хорошо протестированных путей переключения при сбое. * Обеспечивать непрерывное улучшение состояния безопасности в сотрудничестве с командами безопасности, включая управление исправлениями, устранение уязвимостей и настройки платформы по умолчанию, безопасные по своей сути. * Вносить вклад в техническую дорожную карту для инструментов надежности, платформ наблюдаемости и улучшений опыта разработчиков, которые снижают трения и улучшают результаты для инженерных команд. * Наставлять инженеров по всей организации в отношении практик SRE и способствовать созданию сильной, безобвинительной культуры операционного совершенства. Требуемая квалификация * Степень бакалавра в области компьютерных наук, инженерии или смежной технической дисциплины. * Пять или более лет опыта работы в качестве SRE, DevOps или производственного инженера, поддерживающего крупномасштабные распределенные системы. * Сильные навыки программирования как минимум на одном из языков: Python, Go или Java, со способностью создавать надежную автоматизацию и инструменты. * Глубокий практический опыт эксплуатации Linux в масштабе, включая работу с сетями, настройку производительности и устранение неисправностей на уровне системы. * Производственный опыт эксплуатации Kubernetes и контейнерных рабочих нагрузок. * Хорошее практическое знание инструментов наблюдаемости, таких как Prometheus, Grafana, OpenTelemetry, ELK/EFK или их коммерческих аналогов. * Практический опыт проектирования и эксплуатации CI/CD пайплайнов как для инфраструктуры, так и для приложений. * Твердое понимание проектирования распределенных систем, включая модели согласованности, секционирование и семантику отказов. * Подтвержденный опыт руководства реагированием на инциденты и проведения эффективных посмертных анализов. * Отличные коммуникативные навыки и навыки документирования. Предпочтительная квалификация * Опыт определения и внедрения SLO и бюджетов ошибок в реальных производственных средах. * Опыт работы с практиками и инструментами хаос-инжиниринга, такими как Chaos Monkey, Gremlin или Litmus. * Практический опыт работы как минимум с одной крупной облачной платформой (AWS, Azure или GCP). * Опыт в планировании мощностей, инженерии производительности или крупномасштабном нагрузочном тестировании. * Знакомство с технологиями сервисных сеток, такими как Istio, Linkerd или Consul. Как подать заявку Хотите узнать больше об этой возможности? Для оперативного рассмотрения, пожалуйста, отправьте свое резюме на [email protected] или свяжитесь с нами по телефону (908) 505-3899. Узнайте больше о Bright Vision Technologies на www.bvteck.com. Мы признаем, что наши сотрудники — наша сила, и разнообразные таланты, которые они привносят в нашу глобальную команду, напрямую связаны с нашим успехом. Мы являемся работодателем, предоставляющим равные возможности, и придаем большое значение разнообразию и инклюзивности в нашей компании. Мы не дискриминируем по признаку любой защищенной характеристики, включая расу, религию, цвет кожи, национальное происхождение, пол, сексуальную ориентацию, гендерную идентичность, гендерное выражение, возраст, семейное положение или статус ветерана, беременность или инвалидность, или любые другие признаки, защищенные применимым законодательством. Мы также предоставляем разумные приспособления для религиозных обрядов и убеждений соискателей и сотрудников, а также для потребностей, связанных с психическим здоровьем или физическими ограничениями. Bright Vision Technologies — это работодатель, предоставляющий равные возможности, включая инвалидов и ветеранов. Должность предлагается «Агентством без комиссии». Заявление о равных возможностях трудоустройства (EEO) Bright Vision Technologies (BV Teck) стремится к обеспечению равных возможностей трудоустройства (EEO) для всех сотрудников и соискателей без учета расы, цвета кожи, религии, пола, сексуальной ориентации, гендерной идентичности или выражения, национального происхождения, возраста, генетической информации, инвалидности, статуса ветерана или любого другого защищенного статуса, как это определено применимым федеральным, государственным или местным законодательством. Это обязательство распространяется на все аспекты трудовых отношений, включая подбор персонала, найм, обучение, оплату труда, продвижение по службе, перевод, отпуска, увольнение, сокращение штата и повторный прием на работу. BV Teck категорически запрещает любые формы домогательств или дискриминации на рабочем месте. Любое неправомерное вмешательство в способность сотрудников выполнять свои должностные обязанности может повлечь за собой дисциплинарные меры вплоть до увольнения. Для подачи заявки: https://weworkremotely.com/remote-jobs/bright-vision-technologies-site-reliability-engineer-sre

навыки

Стек и инструменты

SRE Kubernetes Python Go Java Prometheus Grafana CI/CD AWS Azure GCP Linux Observability Incident Response Chaos Engineering

грейд

senior

формат

удалённо

зарплата

8 333 – 12 500 $

языки

English — Pre-Intermediate

рынок выше глобал-remote рынка (USD) на 157.7%

Эта вакансия

~ 5 067 072 ₸

Медиана рынка

1 966 431 ₸

53 вакансии DevOps

Открыть на WWR

Создать резюме

Узнайте Match Score и отслеживайте отклики

В избранное

компания

Bright Vision Technologies

Bright Vision Technologies — динамично развивающаяся технологическая компания, специализирующаяся на обеспечении надежности и масштабируемости цифровы...

вакансия

7 ч. назад

на сайте

Все вакансии Bright Vision Technologies

Ваше соответствие

??%

Match Score

войдите и создайте резюме

Войти