IEK GROUP – один из ведущих производителей на рынке электротехнического оборудования. Мы разрабатывает и производим инновационные решения для энергетики, промышленности и инфраструктуры. В рамках цифровой трансформации бизнеса мы расширяем команду аналитиков данных и ищем талантливого Data Scientist.
Вам предстоит работать в Лаборатории Данных - Data Science отделе офиса Данных компании IEK. Отдел - 5 человек с прямым подчинением CDO. 2 daily в неделю по 30 минут + полчаса на работу с тасктрекером.
Прямое подчинение CDO, 2 дня в неделю по 30 минут + полчаса на работу с тасктрекером. Удаленка, любые часовые пояса. Подразделения, отвечающие за данные, находятся с вами в одной структуре, data set-ы вам соберут/помогут собрать. За работу с репозиторием и развертывание решений отвечаете сами. Сервера свои, развернуты локально модели (oss-120b, qwen3-235b, gemma3-27b…) и мощности доступны для расчетов ML моделей.
разрабатывать Аналитические и Дата Ассистенты (TextToSQL/RAG для информации по рынкам/конкурентам и т.п.), сервисами работы с данными (классификация данных, разметка, идентификация персональных данных и т.п.), поисковые сервисы для отчетности и каталога данных.
От кандидата ожидаем, что есть релевантный опыт, если не в полностью аналогичных проектах, то с похожим стеком. Дообучение приветствуется и поощряется, но надо быть готовым сразу с работой по проектам.
Наши ожидания:
Hard Skills (LLM & NLP):
Уверенный опыт работы со стеком NLP/LLM (Transformers, LangChain, LlamaIndex).
Практический опыт реализации RAG-систем и Agentic-пайплайнов.
Глубокое понимание SOTA моделей (как проприетарных, так и Open Source) и методик их дообучения/адаптации.
Особое преимущество: опыт реализации Text-to-SQL решений (знание фреймворков класса Vanna.ai)
Data Engineering & Toolset:
Отличное владение Python и профильными библиотеками (Pandas, NumPy, PyTorch/TensorFlow).
Уверенное знание SQL (MSSQL, PostgreSQL) и понимание архитектуры баз данных.
Опыт работы с Docker и Git.
Знание инструментов оркестрации данных (Airflow).
Аналитика и математика:
Сильный математический бэкграунд (статистика, линал, тервер).
Желателен опыт интеграции ML-решений с BI-системами (Power BI, Superset и др.).
Умение проводить качественный EDA и глубоко аргументировать выбор архитектуры решения.
опыт работы с git, docker, python, SQL, BI, NLP, transformers, langchain, airflow, фреймворки класса vanna.ai