21
1 мес. назад
Инженер данных
Вам предстоит участвовать в полном жизненном цикле данных, проектировать и оптимизировать инфраструктуру данных, а также взаимодействовать с командами аналитиков и ML-инженеров. Мы ищем специалиста с опытом работы с Python и инструментами для обработки данных.
middle
удалённо
Тип занятости
full-time
Опубликовано
15 декабря 2025
Языки
English: Pre-Intermediate
Вакансии в Telegram-канале
Свежие вакансии
Каждый день
описание
НИИ «ВОСХОД» — мультисервисный партнер государства в области информационных технологий с 1972 года. Мы создаем инновационные ИТ-решения для органов власти, внедряем и развиваем новые форматы эффективного взаимодействия между государством и обществом.
Институт специализируется на разработке и эксплуатации информационных систем, услугах в области информационной безопасности (в том числе создании средств криптографической защиты информации), а также разработке и развитии ИТ-архитектуры современных информационных систем и цифровых платформенных решений.
НИИ «ВОСХОД» включен в реестр аккредитованных ИТ-компаний и организаций оборонно-промышленного комплекса.
Ваши будущие задачи:
• Участие в полном жизненном цикле данных: от интеграции источников и обеспечения качества данных до организации удобного доступа для аналитиков и data scientist-ов.
• Проектирование, автоматизация и техническая эксплуатация отказоустойчивых и масштабируемых вычислительных процессов (пайплайнов) для сбора, проверки качества, нормализации, реструктуризации, обогащения больших данных (в том числе геоданных).
• Развитие и оптимизация инфраструктуры данных компании: DWH, Data Lake, систем мониторинга и оркестрации.
• Внедрение лучших практик инженерии данных (тестирование пайплайнов, мониторинг, версионирование, документирование).
• Техническое лидерство и менторство в команде инженерии данных.
• Взаимодействие со смежными командами (аналитики, ML-инженеры, разработчики) для понимания потребностей в данных и реализации эффективных решений.
Для нас важно:
• Опыт разработки с использованием:
• Python (библиотеки для работы с геоданными, для, анализа данных);
• S3 (например, MinIO);
• ClickHouse;
• PostgreSQL, PL/pgSQL;
• PostGIS;
• Parquet (и друге популярные форматы: Iceberg, Avro, ORC, CSV);
• Spark (API на Scala, PySpark);
• Dagster (и другие популярные оркестраторы: AirFlow);
• SQL;
• ОС Linux;
• Будет преимуществом:
• Scala;
• Shapefile;
• JupyterLab (Jupyter Notebook);
• Java;
• Prometheus;
• Graphana;
• ELK;
• Общее знакомство с:
PostgREST;
Kafka;
Docker;
Kubernetes;
Istio;
Hadoop;
HashiCorp Terraform;
RedHat Ansible
Sonatype Nexus;
Go;
JavaScript.
• Опыт развития систем обработки больших данных (сбор, нормализация, реструктуризация):
Анализ потребностей и проектирование архитектуры ПО. Знакомство с DAMA DMBOK, BPMN, микросервисной архитектурой, REST API, Open API;
Спецификация требований к ПО и данным, разработка логического дизайна ПО. Знакомство с C4, UML, ERD;
Разработка физического дизайна и кода ПО для процессов обработки данных (пайплайнов);
Отладка кода, участие в функциональном, нагрузочном, приёмочном тестированиях;
Оптимизация унаследованного кода;
Практика CI/CD;
• Опыт технической эксплуатации систем обработки больших данных:
Развёртывание и настройка процессов обработки данных;
Мониторинг работы процессов обработки данных
Устранение сбоев в работе процессов обработки данных;
• Опыт обеспечения качества данных:
Разработка и тестирование процедур проверки качества данных;
Мониторинг исполнения и результатов процедур проверки качества данных;
Участие в устранении инцидентов, связанных с качеством данных.
• Опыт документирования.
условия
Работу в команде профессионалов;
Стабильную белую и конкурентоспособную заработную плату;
График работы 5/2 с 9-18 либо с 10-19, в пятницу до 16-45/17-45 (формат работы гибрид или удаленно)
Оформление по ТК РФ;
Комфортный, просторный офис (м. Проспект Вернадского/Мичуринский проспект);
Возможность профессионального развития;
Отсутствие опен-спейсов и строгого дресс-кода;
Бесплатную охраняемую парковку на территории офиса;
Тренажерный зал в офисе.
Похожие вакансии
6 вакансии
Разработчик Python (Django/Wagtail)
Ищем разработчика с опытом работы в веб-разработке для создания корпоративного портала. Основные требования: уверенное владение P…
middle
удалённо
QA Engineer
Ищем QA Engineer для разработки автотестов и анализа тестов. Требуется знание P…
middle
удалённо
Разработчик Python
Вам предстоит реализовывать производительные сервисы на Python, участвовать в проектировании архитектуры и ин…
middle
удалённо
Data Engineer / Developer
Вакансия для Data Engineer / Developer в GigaChat. Основные задачи включают написание пайплайнов обработки данных, улучше…
middle
удалённо