Аналитика данных
Аналитика данных и машинное обучение для финансового сектора

58 академических часов
Учебный план
Преподаватели
Журлов Андрей Дмитриевич
SQL
Неофлекс, Ведущий эксперт, направление «Big Data Solution».
Дата-инженер со стажем более 7 лет. Основная сфера задач - проектирование и разработка ETL-процессов и хранилищ в стэке технологий BigData и реляционных БД.
Агафонова Нина Юрьевна
Мат. статистика и тервер
СГУ имени Н.Г. Чернышевского, доцент кафедры теории функций и стохастического анализа.
"Всю жизнь преподаю теорию вероятностей"

Зубоченко Антон Константинович
Python
Неофлекс, ведущий эксперт Data Science.
Я работаю в подразделении, которое занимается машинным обучением. Мой предыдущий опыт связан с решением задач из области nlp и аналитики данных. Кроме того, умею работать с бигдата-фреймворками и решать задачи из области компьютерного зрения.

Асаёнок Константин Александрович
Автоматизация
Неофлекс, Руководитель отдела технической поддержки департамента «Финансовые рынки и управление рисками».
Опыт работы в IT 5 лет, является специалистом в области автоматизации IT-процессов.

Наталья Александровна Никонова
Инструменты командной работы
ФРиР, Заместитель РБН. Финансовые рынки и управления рисками
Работаю в банковской сфере и банковского ИТ-консалтинга с 2001 года. Опыт работы в рыночных рисках, в аналитике для инвестиционных банков, управлении проектами и командами на проектах внедрения ИТ-решений для банков.
SQL для анализа данных
1 блок. 6 занятий
1 занятие
1 занятие
Введение в операторы, группировка и агрегатные функции
Лекция.
Продолжительность: 2 ак. часа
2 занятие
2 занятие
Типы данных и объединение таблиц (JOIN)
Лекция.
Продолжительность: 2 ак. часа
3 занятие
3 занятие
CRUD операции, подзапросы, представления
Лекция.
Продолжительность: 2 ак. часа
4 занятие
4 занятие
Оконные функции
Лекция.
Продолжительность: 2 ак. часа
5 занятие
5 занятие
SQL и Python
Лекция.
Продолжительность: 2 ак. часа
6 занятие
6 занятие
Практическая работа
Оффлайн-выполнение и консультационный семинар
Продолжительность: 2 ак. часа
Теория вероятности и математическая статистика
2 блок. 4 занятия
7 занятие
7 занятие
Случайные события, случайные величины, законы распределения (в т.ч. нормальное, биномиальное, Пуассона и т.п.), квантили
Лекция.
Продолжительность: 2 ак. часа
8 занятие
8 занятие
Проверка гипотез, ошибки первого и второго рода, уровень значимости, доверительный интервал. Сравнение средних и дисперсий, гипотезы о распределениях
Лекция.
Продолжительность: 2 ак. часа
9 занятие
9 занятие
Дисперсионный анализ, множественная проверка гипотез
Лекция.
Продолжительность: 4 ак. часа
10 занятие
10 занятие
Временные ряды. Анализ тренда, анализ сезонности, корреляционный анализ, спектральный анализ (разложение Фурье)
Лекция.
Продолжительность: 4 ак. часа
Python (Numpy, Pandas, Matplotlib)
3 блок. 6 занятий
11 занятие
11 занятие
Основы Python. Управляющие конструкции и коллекции. Работа с файловой системой. Функции и классы.
Лекция.
Продолжительность: 4 ак. часа
12 занятие
12 занятие
Основы парсинга и работа с API. Работа с данными, визуализация. Описательный и статистический анализ данных
Лекция.
Продолжительность: 4 ак. часа
13 занятие
13 занятие
Бизнес-анализ: когортный анализ данных, retention, unit-экономика
Лекция.
Продолжительность: 4 ак. часа
14 занятие
14 занятие
Принятие решений на основе данных. A/B тестирование
Лекция.
Продолжительность: 4 ак. часа
15 занятие
15 занятие
Прогнозы и предсказания
Лекция.
Продолжительность: 4 ак. часа
16 занятие
16 занятие
Практическая работа
Оффлайн-выполнение и консультационный семинар
Продолжительность: 2 ак. часа

Автоматизация и визуализация данных
4 блок. 3 занятия
17 занятие
17 занятие
ML-пайплайны и дашборды
Лекция.
Продолжительность: 2 ак. часа
18 занятие
18 занятие
Обзор основных BI-инструментов: Grafana, Tableau, QlickView, Power BI
Лекция.
Продолжительность: 2 ак. часа
19 занятие
19 занятие
Практическая работа
Оффлайн-выполнение и консультационный семинар.
Продолжительность: 2 ак. часа
Инструменты командной работы
5 блок. 2 занятия
20 занятие
20 занятие
Методология Agile: Особенности применения Scrum и Kandban в работе Data Science команд
Лекция.
Продолжительность: 2 ак. часа
21 занятие
21 занятие
Инструменты командной работы: управление проектами (jira), базы знаний (confluence), системы контроля версий на примере Git
Лекция.
Продолжительность: 2 ак. часа
Итоговый проект
6 блок. 1 занятие
22 занятие
22 занятие
Практическая работа
Оффлайн-выполнение и консультационный семинар.
Продолжительность: 2 ак. часа