4 11 ч. назад

Middle+/Senior Data Engineer (Image & Video)

Вакансия для Data Engineer с опытом работы в сборе и обработке данных. Основные задачи включают разработку скриптов на Python, контроль качества данных и взаимодействие с ML командой. Предлагается работа в международной команде на облачной видео-платформе.

middle удалённо
Опубликовано
12 февраля 2026
Языки
English: Pre-Intermediate
Вакансии в Telegram-канале
Свежие вакансии Каждый день
Подписаться
??%
Match Score
Войдите и создайте резюме
Войти

описание

Мы поисках Middle+/Senior Data Engineer (Image & Video) на проект по интелекуальному видеонаблюдению. Ищем инженера для сбора, очистки и контроля качества изображений и видео из открытых источников. Роль сфокусирована на стабильном и легальном сборе данных, их технической подготовке и базовой аналитической проверке перед передачей в ML команду. Продукт: облачная видео-платформа, цель которой анализировать огромное количество видеопотоков, детектировать события и производить поиск по ним в реальном времени. Продукт на данный момент помогает крупным компаниям решать различные задачи: пропуск сотрудников в производственные помещения, обнаружения пожаров, расследование инцидентов и др. На рынке уже порядка 15 лет и имеет амбициозные перспективы для дальнейшего развития. География продукта покрывает множество стран СНГ, Азии и другие. Технологии: продукт включает в себя множество сервисов, реализованных на Java, Go, C++, и разворачивающихся в виде контейнеров в Kubernetes. Команда проекта: 65+ человек: Back-end (Java), Front-End (Angular), Manual QA + AQA(Python), R&D (аналитика на C++, DL Engineer), Admin (k9s cluster).
Сбор изображений и видео из открытых источников (web, python API, публичные датасеты, production кластеры);
Разработка и поддержка Python-скриптов и пайплайнов сбора данных;
Очистка и подготовка данных: изображения, видео, метаданные;
Контроль качества данных: проверка blur / резкости, контроль размеров, разрешений и форматов, выявление пустых, битых и дублирующихся кадров;
Базовая аналитика датасетов: подсчёт объёмов и распределений, проверка полноты и однородности данных, простые метрики качества;
Подготовка данных в формате, готовом к использованию ML-командой.

требования

Языки и инструменты:
Python — уверенный уровень;
Инструменты веб-сбора: Requests, BeautifulSoup, Selenium, Scrapy;
Опыт сбора и парсинга данных от 2 лет.
Общие требования по сбору:
Бытовая сообразительность, необходимая для нахождения путей решения нестандартных задач сбора;
Коммуникабельность, готовность находить людей, необходимых для решения конкретных задач сбора и общаться с ними до получения нужных данных;
Английский язык на уровне письменной коммуникации с сотрудниками из других регионов для организации удаленного сбора: B1 или выше.
Работа с изображениями и видео
Понимание форматов: JPEG / PNG; MP4 / AVI;
Опыт работы с: OpenCV, ffmpeg, PIL;
Умение: извлекать кадры из видео, масштабировать и кропать изображения, применять базовые фильтры, автоматизировать проверки качества данных.
Аналитическая база (базовый уровень):
Понимание принципов качества данных (data quality);
Работа с метаданными и простыми агрегатами;
Умение оценивать датасет и находить проблемы до передачи в ML.
Инфраструктура:
Python
Linux
Docker
Будет плюсом
Понимание Computer Vision / ML на концептуальном уровне;
Знание принципов: object detection, OCR, video analytics;
Опыт работы с: YOLO, Qwen VL;
Базовое понимание ML-pipeline;
Опыт работы с чувствительными данными и понимание юридических ограничений;
Опыт использования OpenRouter;
Опыт работы с Яндекс Толока и Amazon Turk.

Похожие вакансии

6 вакансии
СДЭК
СДЭК
1 д. назад

Аналитик по экономике лояльности

Вакансия для аналитика, который будет развивать экономику лояльности и принимать решения на основе данных. Требуется опыт в аналитике, уверенное пользование SQL и понимание юнит-экономики. Предлагается конкурентный доход и удаленный формат работы.

middle удал.
Газпромбанк Автолизинг
Газпромбанк Автолизинг
1 д. назад

Портфельный аналитик

Газпромбанк Автолизинг ищет Портфельного аналитика для анализа и оптимизации систем принятия решений в лизинговых сделках. Важны навыки работы с SQL и опыт в риск-менеджменте. Компания предлагает возможности для профессионального роста и расширенный социальный пакет.

Анализ рисков · Портфельный анализ · Работа с большим объемом информации ·+2

middle удал.
Билайн
Билайн
1 д. назад

Data Scientist

Билайн ищет Data Scientist для работы над ML-продуктами. Требуется опыт в Data Science, уверенное владение Python и SQL, а также понимание статистики. Предлагается дистанционная работа и множество корпоративных льгот.

ML · SQL · Spark ·+3

middle удал.
Билайн
Билайн
6 д. назад

Data Engineer

Присоединяйтесь к команде Билайн в роли Data Engineer! Вы будете заниматься разработкой и оптимизацией хранимых процедур на PostgreSQL, а также работать с ETL-инструментами и Apache Spark. Компания предлагает возможность удаленной работы и множество социальных льгот.

Apache Spark · ETL · SQL ·+1

middle удал.
Бюро цифровых проектов
Бюро цифровых проектов
1 нед. назад

Data Engineer

Компания ищет Data Engineer для разработки и поддержки хранилища данных. Требуется знание SQL, Python и опыт работы с Airflow. Предлагается гибридный или удалённый формат работы с полной занятостью и официальным оформлением.

Python · SQL · REST API ·+2

middle удал.
Banks Soft Systems
Banks Soft Systems
1 нед. назад

Инженер по данным

В компании Banks Soft Systems открыта вакансия инженера по данным. Вы будете заниматься разработкой и сопровождением ETL-процессов, а также оптимизацией кода и взаимодействием с другими командами. Предлагается удаленная работа и полный социальный пакет.

middle удал.