О себе
Инженер в области Data Science / Machine Learning с опытом разработки и оптимизации моделей машинного обучения. Владею Python и библиотеками NumPy, pandas, scikit-learn, Matplotlib/Seaborn для анализа и подготовки данных. Имею опыт работы с PyTorch и Docker, а также базовые знания SQL и работы с базами данных.
Опыт работы
ELC Almaty
Преподаватель английского языка
Разрабатывал и проводил уроки английского языка, адаптируя учебные материалы под разный уровень подготовки студентов. Развил навыки коммуникации, публичных выступлений и работы с аудиторией в динамичной образовательной среде.
Проекты
Разработал групповую систему рекомендации ресторанов для Алматы на базе многоязычного семантического поиска (multilingual-e5-large). Реализовал четыре стратегии группового принятия решений — «Среднее», «Слияние векторов», «Наименьшие потери» и «Максимальное удовольствие» — для согласования противоречивых предпочтений участников. Рестораны ранжируются по собственной модели оценки: семантическое сходство меню и отзывов, рейтинг со скидкой за давность, геопространственная близость (формула Хаверсина / гауссово убывание) и популярность. Продукт реализован в виде Telegram-бота с полноценным управлением событиями и состоянием участников. Стек: Python, Sentence-Transformers, Scikit-learn, SciPy, Pandas, NumPy, SQLite, pyTelegramBotAPI
Построил полный пайплайн развёртывания ML-модели, имитирующий продакшен-среду от начала до конца. Обучил модель, открыл доступ через REST API на FastAPI и создал интерактивный Streamlit-интерфейс для инференса. Контейнеризировал оба сервиса с помощью Docker (отдельные Dockerfile для API и UI). Интегрировал MLflow для отслеживания экспериментов, версионирования модели и управления её жизненным циклом. Стек: Python, FastAPI, Streamlit, Docker, MLflow, Scikit-learn, Joblib, Uvicorn
Спроектировал и реализовал сквозной пайплайн пакетного ML-инференса, имитирующий реальные производственные нагрузки. В отличие от потоковой обработки в реальном времени, система планирует предсказания асинхронно, что оптимально для масштабных задач: рекомендательные системы, ночные задания на скоринг. Пайплайн охватывает обучение модели, сериализацию, инициализацию базы данных и планирование пакетного выполнения. Стек: Python, Scikit-learn, SQLite, Pandas
Разработал классификатор изображений для 10 видов животных с применением transfer learning на предобученной ResNet18. Заморозил ранние сверточные слои и дообучил только последний residual-блок и классификатор — это существенно сократило время обучения без потери точности. Применил аугментацию данных (случайные отражения, повороты, изменение цвета) с ImageNet-нормализацией, и аккуратно разделил трансформы для train/val, чтобы исключить data leakage. Провел оценку через матрицу ошибок и полный classification report (precision, recall, F1) по всем 10 классам. Стек: Python, PyTorch, torchvision, Scikit-learn, Matplotlib, Seaborn, датасет Kaggle Animals-10
Образование
Казахско-Британский Технический Университет (КБТУ)
2023 — 2027Вычислительная техника и программное обеспечение
Бакалавр