Перейти к содержимому

Алан Мусабек

Инженер в области Data Science / Machine Learning

Стажёр Офис Алматы, Казахстан
9 мес. опыта 27 навыка

О себе

Инженер в области Data Science / Machine Learning с опытом разработки и оптимизации моделей машинного обучения. Владею Python и библиотеками NumPy, pandas, scikit-learn, Matplotlib/Seaborn для анализа и подготовки данных. Имею опыт работы с PyTorch и Docker, а также базовые знания SQL и работы с базами данных.

Опыт работы

ELC Almaty

09.2024 — 06.2025 9 мес.

Преподаватель английского языка

Офис Алматы

Разрабатывал и проводил уроки английского языка, адаптируя учебные материалы под разный уровень подготовки студентов. Развил навыки коммуникации, публичных выступлений и работы с аудиторией в динамичной образовательной среде.

Проекты

RestRec Bot — Интеллектуальная система рекомендации ресторанов

Разработал групповую систему рекомендации ресторанов для Алматы на базе многоязычного семантического поиска (multilingual-e5-large). Реализовал четыре стратегии группового принятия решений — «Среднее», «Слияние векторов», «Наименьшие потери» и «Максимальное удовольствие» — для согласования противоречивых предпочтений участников. Рестораны ранжируются по собственной модели оценки: семантическое сходство меню и отзывов, рейтинг со скидкой за давность, геопространственная близость (формула Хаверсина / гауссово убывание) и популярность. Продукт реализован в виде Telegram-бота с полноценным управлением событиями и состоянием участников. Стек: Python, Sentence-Transformers, Scikit-learn, SciPy, Pandas, NumPy, SQLite, pyTelegramBotAPI

Деплой ML-модели — FastAPI + Streamlit + Docker + MLflow

Построил полный пайплайн развёртывания ML-модели, имитирующий продакшен-среду от начала до конца. Обучил модель, открыл доступ через REST API на FastAPI и создал интерактивный Streamlit-интерфейс для инференса. Контейнеризировал оба сервиса с помощью Docker (отдельные Dockerfile для API и UI). Интегрировал MLflow для отслеживания экспериментов, версионирования модели и управления её жизненным циклом. Стек: Python, FastAPI, Streamlit, Docker, MLflow, Scikit-learn, Joblib, Uvicorn

Симуляция ML в продакшене — Пайплайн пакетных предсказаний

Спроектировал и реализовал сквозной пайплайн пакетного ML-инференса, имитирующий реальные производственные нагрузки. В отличие от потоковой обработки в реальном времени, система планирует предсказания асинхронно, что оптимально для масштабных задач: рекомендательные системы, ночные задания на скоринг. Пайплайн охватывает обучение модели, сериализацию, инициализацию базы данных и планирование пакетного выполнения. Стек: Python, Scikit-learn, SQLite, Pandas

CNN Animal Classification — Transfer Learning на базе ResNet18

Разработал классификатор изображений для 10 видов животных с применением transfer learning на предобученной ResNet18. Заморозил ранние сверточные слои и дообучил только последний residual-блок и классификатор — это существенно сократило время обучения без потери точности. Применил аугментацию данных (случайные отражения, повороты, изменение цвета) с ImageNet-нормализацией, и аккуратно разделил трансформы для train/val, чтобы исключить data leakage. Провел оценку через матрицу ошибок и полный classification report (precision, recall, F1) по всем 10 классам. Стек: Python, PyTorch, torchvision, Scikit-learn, Matplotlib, Seaborn, датасет Kaggle Animals-10

Образование

Казахско-Британский Технический Университет (КБТУ)

2023 — 2027

Вычислительная техника и программное обеспечение

Бакалавр

Навыки

Python NumPy Pandas Scikit-learn Matplotlib Seaborn PyTorch SQLite Docker FastAPI Streamlit MLflow Joblib Uvicorn Sentence-Transformers SciPy pyTelegramBotAPI torchvision LSTM DDPM ResNet18 Transfer Learning Data Augmentation Git Linux Kaggle GitHub

Языки

Английский C1 — Продвинутый
Русский C2 — Владение в совершенстве
Казахский Родной
Ссылка скопирована