Проекты
RAG-агент по Трудовому кодексу РФ
Разработал pipeline парсинга и структурирования Трудового кодекса РФ с генерацией синтетических вопросов с помощью LLM. Дообучил embedding-модель E5-multilingual-small на доменных данных с использованием contrastive learning (InfoNCE Loss + in-batch negatives mining) с PyTorch и Transformers, повысив Recall@10 с 0.81 до 0.87. Внедрил векторный поиск с использованием Qdrant, настроил гибридный retrieval (dense + sparse). Спроектировал и разработал API сервиса на FastAPI. Создал RAG-агента в Langchain с памятью диалога в Redis для многопользовательского взаимодействия; поддержка режимов single-shot и multi-hop retrieval. Реализовал контейнеризацию через Docker и Docker Compose. Настроил трекинг работы агента в LangSmith и логирование всей системы через Loguru.
Дообучение Qwen3-8B-Base на генерацию Python кода
Реализовал LoRA и Prompt Tuning на PyTorch с нуля для адаптации модели под генерацию Python-кода. Реализовал функции оценки перплексии модели. Снизил перплексию модели на 48% после дообучения на специализированном датасете.
Прокси-система маскирования личной информации при взаимодействии с LLM
Дообучил DistilBert на задачу NER личных данных с Transformers, достигнув F1= 0.93 на валидационной выборке. Развернул модель в Triton с мониторингом в Prometheus + Grafana. Контейнеризовал систему в Docker и спроектировал REST API (FastAPI) для взаимодействия пользователя с системой.
Обучение RNN на генерацию подписей к изображениям
Реализовал на PyTorch сеть, основанную на Inception и LSTM. Дообучил модель в PyTorch на генерацию подписи к изображению. Оценил работу модели на изображениях с интернета.
Образование
МГТУ им. Н. Э. Баумана
Прикладная математика и информатика
БакалаврОбразовательный центр VK в МГТУ
2025 — 2026программа ML
КурсыVK
2026Глубокий NLP
Курсы