Lead Data Scientist (LLM)
Ищем опытного Lead Data Scientist для руководства направлением LLM в центре ИИ при МГТУ. Нужно управлять командой, проектировать и внедрять NLP/LLM-решения, включая RAG и агентные сценарии. Предлагают лидерскую роль, гибридный график и возможности для обучения.
Зарплата не указана — оценили по рынку
На основе 15 похожих вакансий за 90 дней.
Что предстоит делать
Навыки: Python, LLM, NLP. Квалификация: Senior. Специализации: Ученый по данным. **НОЦ \"Технологии искусственного интеллекта\" на базе МГТУ им. Н.Э. Баумана приглашает Lead Data Scientist (LLM)****.** На базе Центра ведется разработка и внедрение масштабных проектов с применением искусственного интеллекта для крупных федеральных заказчиков, реализуются проекты разработки для коммерческого сектора, а также наукоемкие проекты. **Ваши задачи:** - Организация работы команды и управление DS направления LLM по закрепленным проектам. - Планирование, декомпозиция задач, приоритизация и распределение работы внутри команды. - Обеспечение и контроль выполнения задач в срок без потери качества - Участие в формировании команды разработки. - Развитие команды: менторство, онбординг, повышение уровня самостоятельности разработчиков. - Проведение code review. выявление и исправление архитектурных и логических ошибок в процессе разработки. - Проектирование и реализация LLM‑решений для прикладных сценариев: QA‑ассистенты, поиск по документам, аналитические помощники, классификация/извлечение сущностей и др. (основной фокус — NLP/LLM). - Подбор наиболее эффективных инструментов для реализации LLM‑решений. - Построение RAG‑пайплайнов: подготовка и чанкинг данных, индексация, retrieval (в т.ч. с фильтрами), rerank, генерация ответа, обработка “no answer”. - Адаптация моделей под домен: prompt‑engineering, SFT/LoRA (или другие подходы fine‑tuning), подбор датасета/разметки, анализ ошибок и итерации. - Разработка и поддержание агентных сценариев: function calling, tool-use, оркестрация шагов, контроль ограничений/политик, обработка исключений, оценка надежности. - Построение системы оценки качества: офлайн‑метрики, тест‑наборы, протоколы human‑eval, интерпретация результатов и план улучшений. - Участие в выводе в прод: прототип → сервис → мониторинг качества/latency/cost, участие в разборе деградаций и регрессий. - Изучение документации/репозиториев и поиск решений на основе best practices с учетом ограничений инфраструктуры. **Мы ожидаем от Вас:** - Высшее техническое образование в области ИТ и /или повышение квалификации в области Data Science. - Опыт работы на лидирующей позиции в области DS, навыки менторства и онбординга. - Владение Python и основными ML-библиотеками (Pandas, Sklearn, Tensorflow, Keras, PyTorch, XGBoost или аналоги). - Понимание классического ML и базовых архитектур нейросетей; умение выбирать метрики и интерпретировать результаты. - Опыт работы с NLP-библиотеками: pymorphy2, NLTK, spaCy, regex. - Опыт работы с LLM, prompt-engineering, fine-tuning, RAG, MCP. - Опыт работы с Hugging Face Transformers. - Опыт работы с vLLM. - Опыт работы с векторными БД (Qdrant или аналогами). **Приветствуется:** - Научно-исследовательский опыт, умение оформлять результаты (заметки, отчеты, статьи). - Git (GitLab), FastAPI, Docker/Docker Compose; базовые навыки деплоя и эксплуатации сервисов. - MLOps практики (эксперименты, трекинг, модели/датасеты, мониторинг), SQL. - Kafka/Spark/Hadoop (если есть большие потоки/батчи данных). - Helm, k9s и опыт работы с Kubernetes окружением. - UML (как инструмент коммуникации с командой разработки/аналитики). ** Мы предлагаем Вам:** - Работа в IT- Центре на базе МГТУ им. Н.Э.Баумана. - Амбициозные и интересные задачи. - Возможность дополнительного обучения по программам повышения квалификации. - Возможность повышения академического уровня знаний (аспирантура и докторантура). - Оформление по ТК РФ. - Полная занятость, гибридный график, возможен удаленный формат работы для жителей Москвы и МО. - Удобный офис в пешей доступности от станции метро Бауманская. - Лидерскую роль в направлении интеграции AI-технологий. - Заработная плата обсуждается по результатам собеседования.
Стек и инструменты
Подходит ли вам эта вакансия?
Зарегистрируйтесь и загрузите резюме — посчитаем % совпадения с этой вакансией, подсветим сильные стороны и что стоит подтянуть
Ещё в МГТУ им. Н.Э. Баумана
2 активные вакансии в компании
Разработчик больших языковых моделей (LLM)
~729 300 – 1 458 600 ₸ оценка
Центр ИИ при МГТУ им. Баумана ищет Middle-разработчика LLM. Вы будете создавать и внедрять большие языковые модели, работать с NLP, RAG и агентными системами. Требуется опыт с Python, ML-библиотеками и LLM. Предлагают гибридный график, обучение и оформление по ТК РФ.
Похожие вакансии
6 вакансий
Архитектор (Data/AI)
~3 548 021 – 4 478 606 ₸ оценка
СберЗдоровье, ведущая MedTech-компания России, ищет Архитектора (Data/AI) для проектирования и сопровождения решений в области данных, аналитики и AI/ML. Требуется опыт работы с data-платформами, знание SQL, PostgreSQL, ClickHouse, k8s и других современных инструментов. Предлагается удаленная работа, медицинская программа, курсы английского и спортивные активности.
Senior разработчик Единого Интеграционного Слоя данных
~1 790 100 – 2 652 000 ₸ оценка
Ищем senior-разработчика для лидирования разработки интеграционного слоя данных банка. Нужен опыт от 6 лет, владение Python и BigData стеком. Предлагаем удалёнку, гибкий график, ДМС и возможности роста.
Senior ML разработчик
~3 266 432 – 3 739 502 ₸ оценка
IT-компания GNIVC ищет Senior ML разработчика для работы над классификатором товарных позиций на основе BERT. Требуется опыт в NLP/ML, PyTorch и PostgreSQL. Предлагают удаленную работу, ДМС и возможности для обучения.
Старший Data Engineer
Ищем старшего Data Engineer для работы с Python, Spark и Databricks. Предлагаем удаленный формат и интересные задачи по обработке данных.
Старший Data Engineer
Ищем старшего Data Engineer для работы с Python, Spark и Databricks. Требуется опыт в построении и оптимизации пайплайнов данных. Предлагается удаленная работа.
Старший Data Engineer
Ищем старшего Data Engineer для работы с Python, Spark и Databricks. Требуется опыт в построении и оптимизации пайплайнов данных. Предлагается удаленная работа.