Junior/Middle DE в управление валидации моделей

Data Engineer
IT
Finance
#Python
#SQL
#PySpark
#Hadoop
Москва
фултайм
гибрид
удаленка

Опыт от 1 до 3 лет

от 83.333 ₽ до 208.333 ₽

Описание вакансии

Junior/Middle DE в управление валидации моделей Банка ВТБ

🚀Ищем DE в команду валидации. Мы занимаемся оценкой эффективности моделей и модельных рисков, связанных с подходами к разработке, качеством данных, системами и процессами использования модели.
Мы проводим всесторонний анализ качества моделей, ориентируясь на их реальную эффективность, а не на формальное соответствие метрикам.
Мы не занимаемся разработкой моделей или альтернативным моделированием.

Чем заниматься:
• Сбор и преобразование данных – поиск, загрузка и преобразование данных для анализа.
• Анализ качества данных и выявление аномалий – поиск ошибок, несоответствий и аномалий в данных, работа с данными для выявления слабых мест, которые могут повлиять на точность моделей.
• Автоматизация проверки данных – разработка и внедрение автоматизированных проверок для различных этапов валидации, что позволяет оперативно отслеживать и анализировать состояние данных.
• Развитие библиотек нашей разработки: для автоматизированной подготовки отчетов проведения статистических тестов над моделью и библиотеки для анализа качества данных
• Код-ревью сбора витрин данных.
• Участие в ПСИ витрин данных и моделей.
• Подготовка отчетов по результатам анализа.

Что ожидаем от кандидата:
• Высшее образование (математика, физика, ИТ, технические специальности, экономика с математическим уклоном).
• Понимание стандартов качества данных и умение их применять.
• Хорошее владение инструментами обработки и анализа данных (Python, SQL).
• Ответственность, самостоятельность, способность мыслить аналитически и готовность глубоко разбираться в данных и процессах.

Условия:
• Гибридный формат, преимущественно удаленно, только на территории РФ.
• Конкурентная зарплата, годовой бонус: 100000 – 250000 gross + годовой бонус ~1,5 оклада
• Забота о здоровье – ДМС и страхование жизни.
• Профессиональное развитие и обучение на внешних и внутренних курсах.
• Мы предлагаем возможность решать задачи на уровне мировых стандартов, в команде профессионалов, которые ценят глубину и качество валидации. Мы не за моделирование ради моделирования.

📍Локация: удаленно или гибрид, офис в Москва-Сити, СПб, Самара
Основной стек: Python, SQL, Hadoop, PySpark