Data Engineer
Ищем опытного Data Engineer для работы над платформой данных в направлении Trust & Safety. Вы будете проектировать и разрабатывать потоковые и пакетные процессы для расчёта признаков ML-моделей, используя Kafka, Flink, Redis, Cassandra, S3, Iceberg, Trino, ClickHouse, Airflow и Python. Требуется 4-5+ лет опыта, уверенное владение Kafka и streaming-движками, знание SQL и опыт с ClickHouse.
Зарплата не указана — оценили по рынку
На основе 309 похожих вакансий за 90 дней.
Что предстоит делать
Мы — команда платформы данных в направлении Trust & Safety. Делаем данные и признаки для моделей машинного обучения, которые используются в антифроде, модерации контента и других продуктах. У нас есть как потоковая платформа (Databus/Kafka + Flink + Redis/Cassandra), так и “озеро” данных на S3/Apache Iceberg с доступом через Trino. Мы ищем дата-инженера, который обеспечит расчёт и поставку признаков для ML-моделей — от чтения сырых событий до записи финальных значений в онлайн- и офлайн-хранилища. Стек: Databus(Redpanda)/Kafka, Apache Flink, Redis, Cassandra, S3, Apache Iceberg, Trino, ClickHouse, Airflow, Python, dbt. Вам предстоит: • Проектировать и разрабатывать потоковые процессы, которые читают события из Databus/Kafka и считают онлайн‑признаки, записывая их в Redis и Cassandra. • Проектировать и разрабатывать пакетные процессы, которые читают данные из S3/Iceberg через Trino, считают офлайн‑признаки и пишут результаты обратно в S3/Iceberg и/или ClickHouse. • Следить за тем, чтобы один и тот же признак был согласован между обучением и продакшеном (одна логика расчёта, единый контракт). • Настраивать расписания, пересчёты и бэки, чтобы признаки обновлялись вовремя и выдерживали SLA по свежести. • Работать с качеством данных: добавлять проверки, мониторить аномалии, разбирать инциденты, когда “признак поехал”. • Совместно с DS и аналитиками придумывать новые признаки и помогать перевести их из экспериментальных скриптов в стабильные пайплайны. Вы нам подходите, если: • У Вас 4–5+ лет опыта в роли Data Engineer / Backend+Data; • Имеете уверенный опыт работы с Kafka‑подобными очередями (Databus/Kafka): продюсеры/консьюмеры, партиционирование, ключи, обработка ошибок; • Имеете практический опыт со streaming‑движком (желательно Flink; Spark Structured Streaming подойдёт, если есть реальный прод‑опыт); • Опытны в работе с Redis или Cassandra как онлайновым хранилищем данных/признаков; • Работали с S3‑подобным хранилищем и табличным форматом (Iceberg/Delta/Hudi) и доступа к ним через SQL‑движок (Trino/Presto/Spark SQL); • Отлично знаете SQL и имеете опыт работы с ClickHouse; • Python на уровне уверенной разработки data‑скриптов и сервисной логики; • Имеете опыт настройки и сопровождения пайплайнов в Airflow; • Понимаете задачи ML‑пайплайнов: train/serve skew, пересчёты признаков, влияние задержек и потерь событий.
Стек и инструменты
Подходит ли вам эта вакансия?
Зарегистрируйтесь и загрузите резюме — посчитаем % совпадения с этой вакансией, подсветим сильные стороны и что стоит подтянуть
Ещё в Wildberries и Russ
27 активных вакансий в компании
DBA (Администратор баз данных)
~3 146 581 ₸ оценка
Команда финтеха Wildberries ищет опытного DBA для поддержки и развития высоконагруженных баз данных. Вы будете отвечать за отказоустойчивость, мониторинг и оптимизацию PostgreSQL и ClickHouse, автоматизировать миграции и участвовать в архитектурных обсуждениях. Предлагается гибридный или удаленный формат работы.
Руководитель группы Security SRE
~2 745 600 – 3 875 100 ₸ оценка
Ищем руководителя группы Security SRE для обеспечения безопасности сетевой инфраструктуры Wildberries банка. Вы будете управлять межсетевым экранированием, IDS/IPS, VPN, WAF, организовывать процесс управления уязвимостями и интеграцию с SIEM. Требуется глубокое понимание сетевой безопасности, опыт с enterprise-FW и SIEM, а также навыки управления командой.
Frontend-разработчик (React)
~1 497 600 ₸ оценка
Ищем frontend-разработчика для создания высокопроизводительного почтового сервиса. Нужно уверенно владеть React, TypeScript и современными инструментами. Работа полностью удаленная, полный день.
QA Engineer (Manual Backend)
~850 000 – 1 560 000 ₸ оценка
Ищем QA-инженера для ручного тестирования backend-сервисов в распределенной системе. Нужно проверять REST API, асинхронные процессы и workflow, работать с требованиями. Предлагаем гибридный формат, обучение, ДМС и корпоративные бонусы.
Похожие вакансии
6 вакансийAI инженер (Python, LLM)
~3 146 581 – 4 068 855 ₸ оценка
Разработка и внедрение AI-решений на Python с использованием LLM-фреймворков. Создание AI-агентов и RAG-систем, обеспечение безопасности LLM. Требуется отличный английский и опыт с LLM.
Senior AI Business Analyst
~3 146 581 – 4 068 855 ₸ оценка
Senior AI Business Analyst в MODUS X — українську IT-компанію. Потрібен досвід роботи з даними та AI-рішеннями, знання Python, SQL, Generative AI, LLM. Пропонують офіційне працевлаштування, бонуси, медстрахування та віддалений формат.
Data Engineer
~1 578 915 ₸ оценка
mono шукає досвідченого Data Engineer для роботи з дата-платформою, через яку проходять 10+ мільйонів транзакцій щодня. Потрібен глибокий досвід з ClickHouse або PostgreSQL, SQL, ETL/ELT, Kafka та Airflow. Пропонують гідну винагороду, гнучкий графік, гібрид або віддалену роботу, страхування та курси англійської.
Старший инженер машинного обучения
Старший ML-инженер для построения и масштабирования production-систем персонализации и принятия решений в реальном времени. Нужен опыт с Python/Go, TensorFlow/PyTorch, MLOps (Docker, Kubernetes, Airflow) и облачными платформами. Предлагают удаленную или гибридную работу, конкурентную зарплату и интересные задачи.
Аналитик больших данных
~3 146 581 – 4 068 855 ₸ оценка
Ищем опытного аналитика больших данных для работы над социально значимыми проектами. Требуется экспертное знание SQL и Python, опыт работы с Big Data от 4 лет. Предлагаем удалённый формат, официальное трудоустройство и возможности для профессионального роста.
Data Scientist (RecSys)
~3 146 581 – 4 068 855 ₸ оценка
Ищем опытного Data Scientist для разработки рекомендательных систем в 2ГИС. Нужно создавать алгоритмы рекомендаций заведений, улучшать поиск и персональные подборки. Требуется глубокое знание Python, ML и DL, опыт с рекомендательными системами от 2 лет. Предлагаем удаленную работу, гибкий график и современные технологии.