ML Engineer (ASR/NLP/Information Retrieval)
Будуєте ML-платформу для аналізу аудіо та тексту в складних умовах. Потрібен досвідчений інженер з 5+ роками досвіду в ML/NLP, який вміє тренувати моделі (ASR, VAD, NLP) і доводити їх до продакшну з використанням PyTorch, ONNX, Triton. Пропонується робота в маленькій команді з низькою бюрократією та фокусом на якість.
Зарплата не указана — оценили по рынку
На основе 310 похожих вакансий за 90 дней.
Что предстоит делать
<p><strong>Обучать, доводить до продакшна и интегрировать модели для</strong> <br><strong>анализа аудио и текстовой информации в шумных, реальных</strong> <br><strong>условиях.</strong></p><p><strong>О ПРОЕКТЕ:</strong> <br>Мы строим <nobr>ML-платформу</nobr> для анализа аудио и текстовой информации — с<br>высокой зашумленностью, сложными акустическими условиями и большим<br>разнообразием лексики. Это полный life-cycle: сбор и подготовка данных,<br>обучение моделей (ASR, VAD, классификация текста, NER, эмбеддинги),<br>экспорт в продакшн (ONNX / TensorRT / Triton) и интеграция в потоковые<br>пайплайны (Apache Flink, RabbitMQ, Kafka). Конечные потребители — аналитики,<br>работающие с большими объемами информации; поэтому качество моделей и<br>качество их инженерной реализации одинаково критичны.</p><p><br><strong>ЧЕМ ВЫ БУДЕТЕ ЗАНИМАТЬСЯ</strong> <br>Обучать и доводить до продакшна модели в трех смежных доменах:</p><ul><li>ASR Speech-to-text — fine-tuning современных архитектур (CTC, RNN-T, TDT, attention-based) на шумных аудио. PyTorch Lightning, NeMo, Hydra-конфиги, multi-GPU.</li><li>VAD Voice activity detection — fine-tuning рекуррентных и CNN-based моделей на спектрограммах, threshold optimization, ROC-анализ.</li><li>NLP / IR Текст и поиск — multi-label классификация на трансформерах и классических методах, NER, дедупликация текста (MinHash LSH) и аудио (contrastive embeddings, SimCLR), векторный и полнотекстовый поиск.</li></ul><p><br>— Экспортировать модели в ONNX, готовить TensorRT-планы (FP16, optimization profiles, dynamic shapes), интегрировать в NVIDIA Triton (ensemble, BLS, dynamic batching, instance groups).<br>— Строить продакшн-сервисы: FastAPI-фронты, асинхронные воркеры на RabbitMQ / Kafka / S3 / Redis, интеграция в Flink-пайплайны.<br>— Проводить тщательные бенчмарки: WER, F1 per-class, ROC-AUC, RTFx, throughput, A/B-тесты с людьми-разметчиками (Prodigy).</p><p>— Читать papers, воспроизводить state-of-the-art подходы и адаптировать их под наши данные.</p><p>— Версионировать данные и модели (DVC + MinIO/S3), трекать эксперименты (Weights & Biases), писать тесты (pytest), проходить code review.</p><p><br><strong>ОБЯЗАТЕЛЬНЫЕ ТРЕБОВАНИЯ</strong></p><ul><li>5+ лет коммерческого опыта в ML / NLP / Information Retrieval. <nobr>CV-опыт</nobr> не нужен.</li><li>Python как основной язык — уверенное владение современным Python (3.11+), типизация, async/await, написание чистого поддерживаемого кода.</li><li>PyTorch на уровне автора кастомных training loops — не только Trainer.fit(), но и написание своих loop-ов, distributed training (DDP, gradient accumulation, mixed precision), понимание того, как работают loss-функции под капотом (CTC, RNN-T, contrastive losses).</li><li>Как минимум один глубокий опыт в одном из направлений: ASR / sequence-to-sequence, классический NLP на трансформерах и классических методах, или Information Retrieval (BM25, dense retrieval, MinHash / LSH, ранжирование).</li><li>Способность читать и воспроизводить papers — брать модель или подход из arXiv, понимать trade-offs, адаптировать под свои данные, а не только запускать готовые скрипты.</li><li>Инженерия продакшна — опыт доведения модели от ноутбука до сервиса: экспорт (ONNX / TorchScript), оптимизация инференса, построение REST / gRPC API, написание тестов (unit + integration).</li><li>HuggingFace экосистема — уверенная работа с transformers, datasets, tokenizers, accelerate, evaluate, hub; опыт fine-tuning, custom training loops, кастомных токенизаторов (BPE, SentencePiece, WordPiece).</li><li>Классический ML — sklearn, XGBoost, threshold tuning для imbalanced multi-label задач, метрики Precision / Recall / F1 (macro/micro/per-class), ROC-AUC.</li><li>Git, pre-commit, линтеры, CI — воспринимать эти вещи как норму, а не как помеху. Английский — чтение технической документации и papers без затруднений.</li></ul><p><strong>БУДЕТ ПЛЮСОМ</strong></p><ul><li>NVIDIA Triton Inference Server — ensemble, BLS, Python backend, config.pbtxt.</li><li>TensorRT — компиляция engine, optimization profiles, INT8/FP16 квантизация.</li><li>ONNX Runtime — оптимизация графов, провайдеры (CUDA / TensorRT / CPU).</li><li>Data engineering — Apache Flink, Kafka, потоковая обработка, DVC, data pipelines.</li><li>Инфраструктура — Docker, Kubernetes, Helm, ArgoCD, GitLab CI, AWS (S3, CodeArtifact).</li></ul><p><br><strong>СТЕК, С КОТОРЫМ ВЫ БУДЕТЕ РАБОТАТЬ:</strong> <br>CORE Python 3.11+, uv, PyTorch, PyTorch Lightning, HuggingFace (transformers, datasets, tokenizers, accelerate), spaCy, sentence-transformers, sklearn, XGBoost.</p><p>ИНФЕРЕНС ONNX Runtime, TensorRT, NVIDIA Triton; FastAPI, Uvicorn, asyncio, Pydantic v2.</p><p>ДАННЫЕ RabbitMQ, Kafka, Apache Flink; S3 / MinIO, Elasticsearch, PostgreSQL, Redis Stack.</p><p>MLOPS DVC, Weights & Biases, GitLab CI/CD, Kubernetes, ArgoCD; jiwer (WER), torchmetrics, scikit multilearn, Prodigy.</p><p><br><strong>КАК МЫ РАБОТАЕМ:</strong></p><ul><li> Маленькая команда, низкая бюрократия; решение принимает инженер, владеющий контекстом.</li><li> Каждое изменение модели или инфраструктуры имеет четкие бенчмарки до/после — мы не «чувствуем, что лучше», мы измеряем.</li><li> Production-mindset с самого начала: любая модель из ноутбука должна иметь план выхода на сервер.</li><li> Документация, диаграммы архитектур, честные post-mortem-ы, культура writing-it-down.</li></ul> <div> <a href="https://jobs.dou.ua/companies/ews-army/vacancies/359997/#reply-btn-id">Откликнуться на вакансию</a> </div>
Стек и инструменты
Подходит ли вам эта вакансия?
Зарегистрируйтесь и загрузите резюме — посчитаем % совпадения с этой вакансией, подсветим сильные стороны и что стоит подтянуть
Похожие вакансии
6 вакансийІнженер комп'ютерного зору
Вакансія інженера комп'ютерного зору для роботи над реальними задачами автономності та edge AI. Потрібен досвід від 3 років у Computer Vision/Machine Learning, впевнене володіння Python, PyTorch, OpenCV та C++. Компанія пропонує офіційне працевлаштування, допомогу з релокейтом та оплачувану відпустку.
Senior Computer Vision Engineer
Senior Computer Vision Engineer в Phantom Defense — разработка и внедрение моделей компьютерного зрения для систем противодействия БПЛА. Требуется 4+ года опыта в CV/Deep Learning, сильный Python, опыт с YOLO, PyTorch, TensorRT и деплоем в production. Предлагают работу над реальными боевыми продуктами, конкурентную зарплату и офис в Киеве.
Python-разработчик (аналитика, ETL)
~3 107 362 – 4 018 140 ₸ оценка
Разработка Python-сервисов для аналитики и ETL, работа с большими данными, ClickHouse и PostgreSQL. Требуется опыт с асинхронной обработкой и созданием дашбордов. Предлагается поддержка и рефакторинг существующих сервисов.
Data Scientist
~1 562 340 ₸ оценка
MEGOGO шукає досвідченого Data Scientist для розробки та вдосконалення систем персоналізації, пошуку та рекомендацій на основі даних мільйонів користувачів. Потрібен досвід від 3 років, глибокі знання Python, NLP, рекомендаційних алгоритмів та MLOps. Компанія пропонує цікаві завдання, стабільність та широкі можливості для розвитку.
Solution Architect (AI-платформа)
~3 107 362 – 4 018 140 ₸ оценка
Проєктна роль Solution Architect для побудови AI-платформи в SendPulse. Потрібен досвід з LLM, RAG, мікросервісами та multi-tenant системами. Пропонують роботу з реальними даними та прямий контакт з командами.
Руководитель направления (Senior Data Scientist)
~3 107 362 – 4 018 140 ₸ оценка
Ищем Senior Data Scientist для разработки предиктивных моделей кредитного скоринга. Нужен опыт от 3 лет в банке или МФО, владение SQL, ML и Python, а также навыки менторства. Предлагают гибридный график, ДМС и возможности для профессионального роста.