IT_One

15 6 д. назад

Разработчик платформы данных

Ищем разработчика для работы над платформой данных, использующей Spark и Scala. Требуется опыт работы с Linux, Docker, SQL и DevOps-процессами. Возможен рост до технического лидера в команде.

middle удалённо

Опубликовано

29 января 2026

Вакансии в Telegram-канале

Свежие вакансии Каждый день

описание

Разработка и внедрение Платформы Данных в новой парадигме DataMesh. В рамках платформы создан Домен данных Розницы. В нем будут использованы инструменты и сервисы, поставляемые платформой. А также часть инструментов будет дорабатываться\внедряться командой Домена. Домен является поставщиком(основная функция) и потребителем данных других доменов (типа орг. структура, НСИ и т.п.). Стек: • Spark, SparkStreaming, Scala, как язык для перекладки и обработки данных (ETL). Хранение данных: • ClickHouse - зона витрин и для отчетов BI; • GreenPlum - публичная зона для обмена данными между доменами; • IceBerg, HDFS, S3, - детальные данные Домена; • На развитие в плане использование Tarantool, Cassandra. Оркестраторы:из пула Argo, Dagster, AirFlow. • BI: FineBI, PowerBI, SuperSet; • Среда доступа к данным через SQL: Trino.

Разработка кода загрузки данных из источников в модель данных;

Домена, разработка кода загрузки Витрин;

Проработка с архитектором решений по загрузке и архитектуре кода загрузки;

Подготовка комплекта поставки (релиз) для тестирования и передачи в пром-среду;

Анализ ошибок при возникновении и подготовка баг-фиксов;

Участие в приемо-сдаточных испытания при необходимости;

Рост в сторону Тех. Лида по разработке дата-продуктов с передачей знаний по разработке новым разработчикам;

требования

Опыт работы с Linux на достаточном уровне для работы с файлами, каталогами, основными операциями. Чтение логов, bash-скриптов;

Опыт работы в аналогичной роли от 3-х лет;

Работа с пакетами (установка, обновление и т.п.), настройка cron, cgroups, работа с процессами (нагрузка, порты, kill..);

Опыт работы с GIT, BitBucket - работа в команде разработчиков, ревью кода, pull request, merge, clone, commit, pull, push, stash;

Опыт работы с Docker/K8s;

Опыт работы с системами логирования и мониторинга - Kibana, Grafana, OpenSearch, Splunk, Elasticsearch, Logstash;

Опыт работы с Devops-процессами: Jenkins, Teamcity, опыт в формировании поставки релизов с применением CI/CD подходовж

Опыт работы с SQL - понимание как работает сервер БД с данными, запросами, грантами, транзакциями, индексами и т.п.;

Опыт в разработке ETL/ELT кода либо на инструменте ETL, либо на SQL и процедурном языке БД. Оптимизация запросов;

Опыт работы с NoSQL - архитектура, принцип работы сервера, особенности работы с данными;

Опыт в разработке на Spark / Spark Streaming / pySpark;

Опыт работы с большими объемами данных, применение необходимых подходов и библиотек для загрузки/выгрузки/обработки данных

Будет плюсом:

Знание / опыт работы с Iceberg, Hudi, Deltalake.

Опыт работы с оркестраторами потоков данных, например Argo, Dagster, AirFlow.

навыки

S3 Spark Python Apache Airflow SQL

грейд

middle

формат

удалённо

зарплата

зп не указана

Откликнуться В избранное

О компании

НСПК

Москва

Компания НСПК, расположенная в Москве, является ведущим игроком в сфере разработки и внедрения высоких технологий для финансовых и платежных систем. М...

вакансии

1 мес. назад

на сайте

Все вакансии компании

Match Score

Войдите, чтобы увидеть насколько вакансия вам подходит

Войти

Telegram WhatsApp

Похожие вакансии

6 вакансии

Бюро цифровых проектов

1 д. назад

Data Engineer

Компания ищет Data Engineer для разработки и поддержки хранилища данных. Требуется знание SQL, Python и опыт раб…

middle удалённо

Banks Soft Systems

2 д. назад

Инженер по данным

В компании Banks Soft Systems открыта вакансия инженера по данным. Вы будете заниматься разработкой и сопровождением ETL-проце…

middle удалённо

Ozon

5 д. назад

Дата-саентист

Вакансия для дата-саентиста, который будет заниматься разработкой ИИ-сервисов и решением задач в области машинного обучения. Требуются отли…

middle удалённо

IEK GROUP

5 д. назад

Data Scientist

IEK GROUP ищет Data Scientist для работы в удаленном режиме. Вы будете заниматься разработкой аналитических решений и сервисов для работы с данными, используя с…

middle удалённо

Le Mousse

6 д. назад

Аналитик по работе с маркетплейсами

Вам предстоит анализировать данные по продажам и маркетинговым метрикам, готовить отчеты и автоматизировать проце…

middle удалённо

IT_One

1 нед. назад

Аналитик данных

В компании IT_One открыта вакансия аналитика данных. Вы будете участвовать в миграции данных для крупного банка, рабо…

middle удалённо

Откликнуться