Для поддержания бесперебойной работы и в связи с расширением мы приглашаем в нашу команду Системного администратора Linux.
1. Администрирование аппаратно-программных комплексов (ПАКи)
Поддержка, диагностика и обслуживание аппаратно-программных комплексов, входящих в платформу видеонаблюдения и видео-аналитики.
Мониторинг состояния ПАКов, анализ логов, контроль работы видеопотоков и модулей обработки.
Обеспечение стабильной работы каналов связи между ПАКами, облачной инфраструктурой и ML-модулями.
Выявление и устранение неисправностей на уровне ОС, ПО и сетевой части.
2. Контроль SLA и взаимодействие с 3-й линией поддержки
Контроль своевременного исполнения задач 3-й линией поддержки (инфраструктура, ПАКи, модули аналитики).
Участие в разборе крупных и критических инцидентов.
Эскалация сложных технических проблем и предоставление технической экспертизы.
3. Мониторинг и обеспечение стабильной работы серверов и сервисов
Поддержка работы высоконагруженных сервисов: видеостриминг, ML-обработка, аналитические пайплайны.
Настройка, оптимизация и эксплуатация мониторинга (Prometheus, Grafana, Alertmanager).
Реагирование на аномалии, деградации производительности, рост задержек, сбойные ноды.
Поддержка логирования и анализа логов (Elastic, Loki, Fluentd — если используется).
4. Участие в автоматизации процессов администрирования
Разработка и поддержка Ansible-плейбуков для автоматизации рутинных задач.
Написание и оптимизация shell-скриптов для сопровождения инфраструктуры.
Автоматизация развертывания серверов, обновлений, конфигураций.
Внедрение IaC-подходов совместно с DevOps-командой.
5. Формирование и поддержка базы знаний по инфраструктуре
Документирование конфигураций, топологий, технических регламентов.
Подготовка плейбуков для поддержки ПАКов и сервисов ML/видео-аналитики.
Описание процедур реагирования на инциденты и аварийные ситуации.
6. Поиск узких мест и оптимизация производительности платформы
Анализ нагрузки: CPU, I/O, сеть, дисковые подсистемы, GPU-ресурсы (если используются).
Оптимизация производительности сервисов и серверов под ML-задачи и потоковое видео.
Тюнинг ядра Linux, сетевых стеков, параметров Nginx/HAProxy и систем хранения.
Предложения по повышению отказоустойчивости и масштабируемости.
7. Администрирование серверной и облачной инфраструктуры
Работа с виртуальной инфраструктурой на базе OpenStack:
создание и управление виртуальными машинами;
управление сетями, хранилищами, нагрузкой;
диагностика инцидентов виртуализации.
Поддержка инфраструктурных компонентов:
RabbitMQ, MongoDB, PostgreSQL, Minio, Nginx/HAProxy, Prometheus, Grafana, PowerDNS, WireGuard, OpenVPN.
Backup/restore данных, автоматизация бэкапов.
8. Работа с контейнерами и микросервисами
Поддержка Docker-контейнеров и Docker-окружений для сервисов облачной аналитики.
Оптимизация контейнерных конфигураций для производительности ML-модулей.
(Если используется) участие в эксплуатации систем оркестрации (Kubernetes/OpenShift).
9. Обеспечение безопасности и устойчивости инфраструктуры
Настройка VPN-каналов (WireGuard/OpenVPN) и контроль защищённости коммуникаций.
Управление правами доступа, ключами SSH, учётными записями.
Обновление систем, установка патчей, контроль уязвимостей.
Настройка сетевых правил, firewall, сегментации.
10. Выполнение иных поручений руководства
Участие в инфраструктурных проектах компании.
Подготовка отчётности и аналитики по состоянию IT-систем.
Взаимодействие с DevOps, ML-командой, разработчиками, инженерами ПАКов.