описание
Навыки: TensorFlow, Python, PyTorch, NumPy, Deep Learning, Машинное обучение. Квалификация: Senior. Специализации: ML разработчик.
## О нас
**DataLouna** — киберспортивная аналитика нового поколения. Уже 4 года наша команда превращает сырые данные CS2 и Dota 2 в уникальную статистику, предсказания и эксклюзивные беттинг-линии.
Мы часть крупного IT/киберспортивного холдинга, работаем с топовыми букмекерами.
**Отличие от HLTV и Dotabuff:** не агрегируем публичные данные, а создаём собственные метрики вместе с профессиональными аналитиками и тренерами. На этой базе строим B2B-решения: API, предиктивные модели, уникальные линии.
**Цель:** стать HLTV 2.0 в аналитике и главным поставщиком данных для беттинг-индустрии.
## Слово от CEO
У нас есть то, чего нет у других — уникальная база данных, собранная за годы работы с профессиональными аналитиками. Теперь нужен человек, который раскроет её потенциал.
Мир ML развивается стремительно. Мы не знаем заранее, какой инструмент даст лучший результат — трансформеры, гибридные модели или что-то совсем новое. Поэтому ищем того, кто умеет и любит экспериментировать.
Задачи-вызовы, которые ждут:
- Создать уникальную линию для топового букмекера
- Построить LLM-аналитика для киберспорта
- Найти подходы, которые вытащат максимум из наших данных
Нам не нужен человек, который будет ждать готовых ТЗ. Нужен тот, кто сам предложит гипотезу, проверит её и придёт с результатом.
## О роли
Домен — киберспорт: рекомендательные и скоринговые системы для CS2 и Dota 2.
Ты будешь работать в связке с ML-инженером, который специализируется на классических методах (CatBoost, XGBoost, деревья). Твоя зона — современные архитектуры: трансформеры, нейросети, новые подходы.
Бэкенд-команда готовит инфраструктуру. Профессиональные аналитики помогут разобраться в тонкостях CS2 и Dota 2, вместе будете придумывать фичи.
## Чем будешь заниматься
**Разработка моделей**
- Трансформеры для табличных данных: TabTransformer, FT-Transformer, TabNet
- Модели для последовательностей: Temporal Fusion Transformer, Informer, PatchTST
- Эксперименты с адаптацией LLM-подходов к структурированным данным
- Гибридные архитектуры (нейросети + классика) для устойчивости
**Работа с данными**
- Проектирование признаков вместе с аналитиками: эмбеддинги, временная динамика, контекстные фичи
- Representation learning, contrastive learning
- Сбор и структурирование исторических данных
## Что важно
**Обязательно:**
- Высшее техническое/математическое образование или 5+ лет подтверждённого опыта в ML
- Глубокое понимание трансформеров — не \"использовал библиотеку\", а \"могу модифицировать под задачу\"
- PyTorch (предпочтительно) или TensorFlow
- Python: numpy, pandas, scikit-learn как базовые инструменты
- Опыт с градиентным бустингом (CatBoost / LightGBM / XGBoost)
- Опыт обучения и файнтюнинга нейросетей: оптимизаторы, регуляризация, scheduling
- Понимание temporal validation, data leakage, data drift
**Будет плюсом:**
- Участие в ML-соревнованиях с нейросетевыми подходами
- Опыт с MLOps: Spark, Airflow, ClickHouse
## Условия
- 💰 400 000 – 600 000 ₽ (обсуждается по опыту)
- 📍 Удалённая работа
- ⏰ Гибкий график
## Как проходит отбор
**Скрининг** (15-20 мин) — знакомство, пара вопросов
**Техническое интервью** (1.5-2 часа) — обсуждение опыта, подходов к задачам
**Оффер**
## Как откликнуться
Пришли резюме и ссылки на GitHub / Kaggle / публикации (если есть).
**В сопроводительном расскажи:** последнюю ML-задачу, которую решал — какую бизнес-проблему закрывала, какие подходы использовал, какой результат получил.