Data Engineer / Инженер данных (DWH)
Ищем Data Engineer для работы над DWH в крупном продуктовом проекте. Вы будете проектировать и сопровождать ETL-процессы, оптимизировать хранение данных и становиться экспертом в бизнес-областях. Требуется опыт с DWH, SQL, Apache Airflow и одним из языков программирования (Python, Go, Java).
Зарплата не указана — оценили по рынку
На основе 15 похожих вакансий за 90 дней.
Что предстоит делать
Наша команда превращает терабайты данных в понятные и полезные инсайты, которые используют аналитики и сервис, помогающий миллионам людей путешествовать. Продукт растёт огромными темпами, и вместе с ним растут наши задачи — поэтому мы постоянно развиваем собственное DWH. Хранилище у нас построено на системах хранения данных YTsaurus (кластер MapReduce собственной разработки) и ClickHouse. Для разработки, оркестрации и мониторинга ETL-процессов используется собственный фреймворк, созданный внутри Яндекса. Для организации модели хранения данных на разных уровнях применяются различные методологии проектирования хранилищ данных: Lambda-архитектура, Data Lake, Data Vault. Какие задачи вас ждут Разработка, сопровождение и ревью ETL-процессов поставки данных Вам предстоит создавать конвейеры для извлечения, трансформации и загрузки данных из различных источников, настраивать их расписание и мониторинг. Важно регулярно проверять и улучшать код, быстро исправлять ошибки, а также тщательно документировать все преобразования и потоки данных — как собственные, так и коллег, обеспечивая соответствие стандартам качества и производительности. Проектирование структуры хранения данных в разных слоях хранилища Вы будете определять оптимальные схемы организации данных для каждого слоя, учитывая требования к скорости запросов и объёму хранения. Нужно разрабатывать модели данных, настраивать партиционирование, индексацию и сжатие для повышения производительности, а также согласовывать структуры с командами аналитики и разработки и адаптировать схемы, если бизнес-процессы меняются. Выявление и оптимизация неэффективных участков в процессах поставки данных Вы станете анализировать время выполнения ETL-задач, профилировать данные для обнаружения аномалий и избыточности, пересматривать алгоритмы трансформации для снижения нагрузки на систему. Погружение в данные прикладных бизнес-областей и становление в них экспертом Вы будете детально изучать бизнес-процессы и ключевые метрики компании, разбираться в логике расчёта показателей и источниках их формирования. Мы ждем, что вы • Проектировали DWH (слои, модели хранения данных, ETL-процессы) • Разрабатывали ETL-процессы на Apache Airflow или аналогах • Настраивали поставки данных по API • Разбираетесь в SQL на уровне эксперта • Пишете на одном из языков высокого уровня (Python, Go, Java и т. д.) • Понимаете устройство и архитектуру реляционных баз данных • Знаете основные алгоритмы и структуры данных, особенно используемые в работе с большими данными Будет плюсом, если вы • Пользовались хотя бы одной MPP-СУБД (Greenplum, ClickHouse, Vertica, Teradata и т. д.) • Понимаете принципы работы технологий распределённой обработки данных (Hadoop, MapReduce и MPP)
Стек и инструменты
Подходит ли вам эта вакансия?
Зарегистрируйтесь и загрузите резюме — посчитаем % совпадения с этой вакансией, подсветим сильные стороны и что стоит подтянуть
Ещё в Яндекс
27 активных вакансий в компании
Наставник по Android-разработке
~1 790 100 ₸ оценка
Яндекс Практикум ищет опытного Android-разработчика для роли наставника. Нужно помогать студентам с вопросами, проводить вебинары и улучшать курс. Требуется от 3 лет опыта и умение понятно объяснять. Работа удаленная, частичная занятость.
Наставник в Яндекс Практикум (Full-stack разработчик)
~1 657 500 – 2 154 750 ₸ оценка
Яндекс Практикум ищет наставника для студентов курса по full-stack разработке. Нужно помогать с вопросами, проводить вебинары и давать обратную связь. Требуется коммерческий опыт с Next.js, TypeScript, React, AI-инструментами и деплоем на VPS. Работа удаленная, 2-3 часа в день, с возможностью совмещения с основной работой.
Backend-разработчик (C++) в сервис недвижимости Поиска Яндекса
~1 326 000 ₸ оценка
Яндекс ищет опытного бэкенд-разработчика для создания сервиса недвижимости внутри Поиска. Нужно разрабатывать высоконагруженные компоненты, проектировать масштабируемую архитектуру и интегрировать ML-модели. Ключевое требование — отличное владение C++ или готовность на него перейти.
Backend-разработчик (C++) в сервис недвижимости Поиска Яндекса
Яндекс ищет опытного бэкенд-разработчика для создания сервиса недвижимости внутри Поиска. Нужно разрабатывать высоконагруженные компоненты, проектировать масштабируемую архитектуру и интегрировать ML-модели. Ключевое требование — отличное владение C++ или готовность на него перейти.
Похожие вакансии
6 вакансий
Аналитик данных (FMCG)
~861 900 ₸ оценка
Компания ищет аналитика данных для работы с продажами и дистрибуцией на рынке FMCG. Требуется опыт работы с данными, продвинутое владение Excel и Power Point, знание SQL и Power BI будет плюсом. Предлагается гибридный формат или удаленная работа, белая зарплата и ДМС.
Продуктовый аналитик
~861 900 ₸ оценка
Level.Travel ищет продуктового аналитика для работы над traveltech платформой. Нужно строить дашборды, проводить A/B-тесты и анализировать данные. Требуются уверенные Python и SQL, опыт с ClickHouse. Предлагают гибридный формат, скидки на путешествия и обучение.
Аналитик данных (FMCG)
~861 900 ₸ оценка
Аналитик данных в FMCG: работа с клиентами, анализ рынка, подготовка отчетов. Требуется опыт в FMCG и Excel. Плюсом знание SQL и Python. Удаленная работа, ДМС, карьерный рост.
Аналитик колл-центра (iGaming)
Ищем аналитика для международного iGaming-продукта, который будет анализировать работу колл-центра, строить отчеты и дашборды, влиять на retention и эффективность команды. Требуется опыт аналитики в продажах или колл-центрах от 2 лет, уверенный SQL и Python, знание BI (Tableau) и CRM. Предлагают 100% удаленку, конкурентную зарплату, поддержку обучения и работу без бюрократии.
Аналитик колл-центра (iGaming)
Ищем аналитика для международного iGaming-продукта. Нужно анализировать работу колл-центра, строить дашборды и влиять на метрики. Требуется опыт от 2 лет, SQL и Python. Предлагают удаленку, обучение и реальное влияние на бизнес.
AI / Data специалист
~861 900 ₸ оценка
Компания-лидер в сфере доверительного управления и инвестиций ищет опытного Data специалиста для развития корпоративного хранилища данных и отчетности. Нужен коммерческий опыт от 3 лет, глубокое знание SQL и Oracle, а также навыки работы с AI-инструментами и RAG. Предлагают удаленный или гибридный формат, белую зарплату, годовой бонус и обширный соцпакет.