Data engineer
50
количество часов
теории
24
количество часов
практики
Проект
в портфолио после выполнения курсового задания
Программа обучения
Лекции по профилю
Создание и управление таблицами
Выборка данных из нескольких таблиц. Подзапросы
Агрегирование данных, оконные функции
Особенности DWH и DataLake. Hadoop: HDFS
Практика HDFS, Sqoop
Apache Hadoop
Spark: Введение
Spark: Подробно
Spark SQL: Практика
NoSQL, подробнее о HBase
Apache Kafka

Вам подойдет этот курс, если...

  • Вы знакомы с ООП в контексте: python/java
  • Вы знаете основы SQL: select, join и хотите изучать его глубже
  • Вы изучали основы реляционных БД
  • Вы изучали BigData и вам интересно в этом развиваться

Материалы для самоподготовки