Lakehouse для аналитиков и инженеров данных

0/5 ·
Создан: 28 октября 2025 г. Обновлён: 23 марта 2026 г.

Масштабирование аналитических систем до х100 раз становится возможным при переходе на архитектуру Lakehouse с разделением слоев вычислений (Compute) и хранения (Storage). В основе программы — работа с современным стеком, где кластер Trino разворачивается в Kubernetes и обращается к данным в формате Iceberg на S3.

Внутри курса разбираются:

  • Принципы построения Lakehouse, которые пришли на смену традиционным аналитическим системам.
  • Технические детали форматов Iceberg и Parquet, определяющие производительность хранения.
  • Настройка и оптимизация кластера Trino, а также анализ метрик выполнения запросов.
  • Создание гибридных пайплайнов обработки данных, объединяющих SQL, Python и Spark.

Программа ориентирована на специалистов уровня Middle и Senior. Вы научитесь проектировать архитектуру данных, которая позволяет работать с огромными объемами информации без необходимости радикальной смены стека при росте нагрузки.

0 · 0 отзывов

Отзывов пока нет. Будьте первым!

Ещё интересные курсы

BIG DATA с нуля Можно купить
436 ₽ 16 740 ₽ −97%

BIG DATA с нуля

Нетология
P
Можно купить
260 ₽ 999 ₽ −74%

Power Query профессиональная загрузка данных

Robert Kirakosyan
Modeling Data Warehouse with Data Vault 2.0 Можно купить
316 ₽ 1 100 ₽ −71%

Modeling Data Warehouse with Data Vault 2.0

Esra Ekiz