Junior/Middle DS х3

Data Scientist
IT
Finance
#Python
#PyTorch
#NLP
#Hadoop
#GPT
#BERT
#TensorFlow
#transformers
#Spark
Москва, Россия
фултайм
гибрид
офис
удаленка

Опыт от 1 до 3 лет

от 120.000 ₽ до 400.000 ₽

Описание вакансии

Позиция: Junior/Middle DS х3
Куда: Альфа-Банк, Лаборатория машинного обучения
Формат работы: полная занятость; офис в Москве; на данной позиции возможна полная удаленка, нет требований ходить в офис
Вилка гросс:
Junior: 120-240K + ежеквартальная премия (~15% от дохода за квартал)
Middle: 240-400k + ежеквартальная премия (~15% от дохода за квартал)

Премия не зависит от kpi и ревью с плюсиками, фактический покрывает налог.

Про нас:
Мы NLP команда Лаборатории машинного обучения Альфа-Банка (под руководством Жени Смирнова). Занимаемся моделями для чат-ботов и голосовых помощников, автоматизируем контроль качества, ищем инсайты в обратной связи клиентов, упрощаем жизнь сотрудникам колл-центра и ускоряем внутреннюю техподдержку с помощью NLP.

Команда состоит из сильных молодых ребят, выпускников ШАД, МФТИ, МГУ, ВШЭ. Мы регулярно участвуем в соревнованиях и хакатонах, в команде несколько kaggle мастеров.
Альфа поддерживает успехи в соревнованиях премией в одну зп за первое место, и в половину зп за второе.

Мы занимаемся полным циклом разработки: от общения с заказчиком с переводом задачи на ml-ный язык до внедрения моделей в промышленный контур. А помогает нам команда разметки, mlops, мониторинга и другие.

Плюшки: гибкий график (нет требований начинать работать в 10:00, главное выполнять задачи вовремя и соблюдать коммуникацию с контрагентами), отличный ДМС со стоматологией, рабочие макбуки, корпоративные скидки.

Сейчас продолжаем расширять команду под новые задачи заказчиков.

Потенциальные задачи для кандидиата:
- Развитие продукта Альфа Помощник Оператора с помощью классических моделей и LLM
- Создание умного поиска по внутреннему каталогу данных

Требования:
- Опыт работы в области машинного обучения и NLP (1+ лет для Middle)
- Знание, понимание архитектур и опыт работы с моделями, такими как GPT, BERT и другими
- Уверенные знания Python и библиотек для машинного обучения (TensorFlow, PyTorch, transformers…)
- Успешный опыт вывода NLP моделей в прод (для Middle)
- Знание основ работы с большими данными и опытом их обработки (Spark, Hadoop)
- Высшее образование в области компьютерных наук, математики или смежных дисциплин
- Английский язык на уровне чтения технической документации

Будет плюсом:
- Опыт построения RAG пайплайнов
- Опыт дообучения моделей поиска под конкретный домен
- Опыт работы с библиотеками для оптимизированного инференса LLM (vLLM, TGI, SGLang, TRT)
- Успешный соревновательный опыт
- Широкий технический кругозор