Окремий спеціальний центр електронної підтримки

20 ч. назад

ML Engineer (ASR/NLP/Information Retrieval)

Будуєте ML-платформу для аналізу аудіо та тексту в складних умовах. Потрібен досвідчений інженер з 5+ роками досвіду в ML/NLP, який вміє тренувати моделі (ASR, VAD, NLP) і доводити їх до продакшну з використанням PyTorch, ONNX, Triton. Пропонується робота в маленькій команді з низькою бюрократією та фокусом на якість.

senior ~3 107 362 – 4 018 140 ₸

Войти и откликнуться источник

Языки: English · Pre-Intermediate

salary intelligence

Зарплата не указана — оценили по рынку

На основе 310 похожих вакансий за 90 дней.

оценка p25–p75

3 107 362 – 4 018 140 ₸

медиана: 3 428 813 ₸

Хотите увидеть распределение по грейдам и городам? Зарплаты Data/ML Калькулятор зарплат

Вакансии в Telegram-канале

Свежие вакансии Каждый день

??%

Match Score

Войдите и создайте резюме

Войти

описание

Что предстоит делать

Обучать, доводить до продакшна и интегрировать модели для анализа аудио и текстовой информации в шумных, реальных условиях.О ПРОЕКТЕ: Мы строим ML-платформу для анализа аудио и текстовой информации — с высокой зашумленностью, сложными акустическими условиями и большим разнообразием лексики. Это полный life-cycle: сбор и подготовка данных, обучение моделей (ASR, VAD, классификация текста, NER, эмбеддинги), экспорт в продакшн (ONNX / TensorRT / Triton) и интеграция в потоковые пайплайны (Apache Flink, RabbitMQ, Kafka). Конечные потребители — аналитики, работающие с большими объемами информации; поэтому качество моделей и качество их инженерной реализации одинаково критичны. ЧЕМ ВЫ БУДЕТЕ ЗАНИМАТЬСЯ Обучать и доводить до продакшна модели в трех смежных доменах:<ul><li>ASR Speech-to-text — fine-tuning современных архитектур (CTC, RNN-T, TDT, attention-based) на шумных аудио. PyTorch Lightning, NeMo, Hydra-конфиги, multi-GPU.</li><li>VAD Voice activity detection — fine-tuning рекуррентных и CNN-based моделей на спектрограммах, threshold optimization, ROC-анализ.</li><li>NLP / IR Текст и поиск — multi-label классификация на трансформерах и классических методах, NER, дедупликация текста (MinHash LSH) и аудио (contrastive embeddings, SimCLR), векторный и полнотекстовый поиск.</li></ul> — Экспортировать модели в ONNX, готовить TensorRT-планы (FP16, optimization profiles, dynamic shapes), интегрировать в NVIDIA Triton (ensemble, BLS, dynamic batching, instance groups). — Строить продакшн-сервисы: FastAPI-фронты, асинхронные воркеры на RabbitMQ / Kafka / S3 / Redis, интеграция в Flink-пайплайны. — Проводить тщательные бенчмарки: WER, F1 per-class, ROC-AUC, RTFx, throughput, A/B-тесты с людьми-разметчиками (Prodigy).— Читать papers, воспроизводить state-of-the-art подходы и адаптировать их под наши данные.— Версионировать данные и модели (DVC + MinIO/S3), трекать эксперименты (Weights & Biases), писать тесты (pytest), проходить code review. ОБЯЗАТЕЛЬНЫЕ ТРЕБОВАНИЯ<ul><li>5+ лет коммерческого опыта в ML / NLP / Information Retrieval. CV-опыт не нужен.</li><li>Python как основной язык — уверенное владение современным Python (3.11+), типизация, async/await, написание чистого поддерживаемого кода.</li><li>PyTorch на уровне автора кастомных training loops — не только Trainer.fit(), но и написание своих loop-ов, distributed training (DDP, gradient accumulation, mixed precision), понимание того, как работают loss-функции под капотом (CTC, RNN-T, contrastive losses).</li><li>Как минимум один глубокий опыт в одном из направлений: ASR / sequence-to-sequence, классический NLP на трансформерах и классических методах, или Information Retrieval (BM25, dense retrieval, MinHash / LSH, ранжирование).</li><li>Способность читать и воспроизводить papers — брать модель или подход из arXiv, понимать trade-offs, адаптировать под свои данные, а не только запускать готовые скрипты.</li><li>Инженерия продакшна — опыт доведения модели от ноутбука до сервиса: экспорт (ONNX / TorchScript), оптимизация инференса, построение REST / gRPC API, написание тестов (unit + integration).</li><li>HuggingFace экосистема — уверенная работа с transformers, datasets, tokenizers, accelerate, evaluate, hub; опыт fine-tuning, custom training loops, кастомных токенизаторов (BPE, SentencePiece, WordPiece).</li><li>Классический ML — sklearn, XGBoost, threshold tuning для imbalanced multi-label задач, метрики Precision / Recall / F1 (macro/micro/per-class), ROC-AUC.</li><li>Git, pre-commit, линтеры, CI — воспринимать эти вещи как норму, а не как помеху. Английский — чтение технической документации и papers без затруднений.</li></ul>БУДЕТ ПЛЮСОМ<ul><li>NVIDIA Triton Inference Server — ensemble, BLS, Python backend, config.pbtxt.</li><li>TensorRT — компиляция engine, optimization profiles, INT8/FP16 квантизация.</li><li>ONNX Runtime — оптимизация графов, провайдеры (CUDA / TensorRT / CPU).</li><li>Data engineering — Apache Flink, Kafka, потоковая обработка, DVC, data pipelines.</li><li>Инфраструктура — Docker, Kubernetes, Helm, ArgoCD, GitLab CI, AWS (S3, CodeArtifact).</li></ul> СТЕК, С КОТОРЫМ ВЫ БУДЕТЕ РАБОТАТЬ: CORE Python 3.11+, uv, PyTorch, PyTorch Lightning, HuggingFace (transformers, datasets, tokenizers, accelerate), spaCy, sentence-transformers, sklearn, XGBoost.ИНФЕРЕНС ONNX Runtime, TensorRT, NVIDIA Triton; FastAPI, Uvicorn, asyncio, Pydantic v2.ДАННЫЕ RabbitMQ, Kafka, Apache Flink; S3 / MinIO, Elasticsearch, PostgreSQL, Redis Stack.MLOPS DVC, Weights & Biases, GitLab CI/CD, Kubernetes, ArgoCD; jiwer (WER), torchmetrics, scikit multilearn, Prodigy. КАК МЫ РАБОТАЕМ:<ul><li> Маленькая команда, низкая бюрократия; решение принимает инженер, владеющий контекстом.</li><li> Каждое изменение модели или инфраструктуры имеет четкие бенчмарки до/после — мы не «чувствуем, что лучше», мы измеряем.</li><li> Production-mindset с самого начала: любая модель из ноутбука должна иметь план выхода на сервер.</li><li> Документация, диаграммы архитектур, честные post-mortem-ы, культура writing-it-down.</li></ul> <div> <a href="https://jobs.dou.ua/companies/ews-army/vacancies/359997/#reply-btn-id">Откликнуться на вакансию</a> </div>

навыки

Стек и инструменты

ML NLP ASR PyTorch ONNX TensorRT NVIDIA Triton FastAPI Kafka Flink DVC Kubernetes Docker GitLab CI AWS

грейд

senior

формат

офис

зарплата

~3 107 362 – 4 018 140 ₸

оценка на основе 310 похожих вакансий

языки

English — Pre-Intermediate

Открыть на источник

Создать резюме

Узнайте Match Score и отслеживайте отклики

В избранное

компания

Окремий спеціальний центр електронної підтримки

Окремий спеціальний центр електронної підтримки — это технологическая компания, специализирующаяся на разработке и внедрении решений в области искусст...

вакансия

4 ч. назад

на сайте

Все вакансии Окремий спеціальний центр електронної підтримки

Ваше соответствие

??%

Match Score

войдите и создайте резюме

Войти

Telegram WhatsApp

Подходит ли вам эта вакансия?

Зарегистрируйтесь и загрузите резюме — посчитаем % совпадения с этой вакансией, подсветим сильные стороны и что стоит подтянуть

Создать аккаунт PDF-парсинг резюме за 2 минуты

??%

Match Score

Похожие вакансии

6 вакансий

MB Digital

18 ч. назад

Інженер комп'ютерного зору

Вакансія інженера комп'ютерного зору для роботи над реальними задачами автономності та edge AI. Потрібен досвід від 3 років у Computer Vision/Machine Learning, впевнене володіння Python, PyTorch, OpenCV та C++. Компанія пропонує офіційне працевлаштування, допомогу з релокейтом та оплачувану відпустку.

Computer Vision Machine Learning Python +6

senior Львів dou DOU.ua

Phantom Defense

19 ч. назад

Senior Computer Vision Engineer

Senior Computer Vision Engineer в Phantom Defense — разработка и внедрение моделей компьютерного зрения для систем противодействия БПЛА. Требуется 4+ года опыта в CV/Deep Learning, сильный Python, опыт с YOLO, PyTorch, TensorRT и деплоем в production. Предлагают работу над реальными боевыми продуктами, конкурентную зарплату и офис в Киеве.

Computer Vision Deep Learning Python +9

senior Киев dou DOU.ua

АВТОФОРМУЛА

1 д. назад

Python-разработчик (аналитика, ETL)

~3 107 362 – 4 018 140 ₸ оценка

Разработка Python-сервисов для аналитики и ETL, работа с большими данными, ClickHouse и PostgreSQL. Требуется опыт с асинхронной обработкой и созданием дашбордов. Предлагается поддержка и рефакторинг существующих сервисов.

Python ETL ClickHouse +3

senior HR cr Careered

MEGOGO

17 ч. назад

Data Scientist

~1 562 340 ₸ оценка

MEGOGO шукає досвідченого Data Scientist для розробки та вдосконалення систем персоналізації, пошуку та рекомендацій на основі даних мільйонів користувачів. Потрібен досвід від 3 років, глибокі знання Python, NLP, рекомендаційних алгоритмів та MLOps. Компанія пропонує цікаві завдання, стабільність та широкі можливості для розвитку.

Data Science NLP Recommendation Systems +4

senior удал. dou DOU.ua

SendPulse

18 ч. назад

Solution Architect (AI-платформа)

~3 107 362 – 4 018 140 ₸ оценка

Проєктна роль Solution Architect для побудови AI-платформи в SendPulse. Потрібен досвід з LLM, RAG, мікросервісами та multi-tenant системами. Пропонують роботу з реальними даними та прямий контакт з командами.

Solution Architect AI LLM +4

senior удал. dou DOU.ua

MoneyMan

19 ч. назад

Руководитель направления (Senior Data Scientist)

~3 107 362 – 4 018 140 ₸ оценка

Ищем Senior Data Scientist для разработки предиктивных моделей кредитного скоринга. Нужен опыт от 3 лет в банке или МФО, владение SQL, ML и Python, а также навыки менторства. Предлагают гибридный график, ДМС и возможности для профессионального роста.

SQL ML Python +3

senior удал. hh hh.kz

Источник Резюме + Match Score