Big Data: Hadoop и экосистема больших данных

0/5 ·
Создан: 18 мая 2023 г. Обновлён: 23 марта 2026 г.

Анализ данных объемом в терабайты требует понимания не одной программы, а целой экосистемы распределенных систем. Здесь показывают, как объединить Hadoop, Spark, Kafka и NoSQL-базы в единую рабочую архитектуру, чтобы решать реальные бизнес-задачи.

Внутри разбирается установка и настройка Hadoop через Hortonworks/Ambari, написание сценариев обработки через Pig и Spark, а также интеграция потоковых данных с помощью Flink и Storm. Вы научитесь выбирать подходящую технологию хранения под конкретную задачу: от реляционных данных в Hive до неструктурированных в Cassandra или MongoDB.

Курс рассчитан на специалистов с базовым опытом программирования (Python или Scala) и пониманием командной строки Linux. Вы освоите проектирование распределенных систем и сможете управлять кластерами с помощью YARN, Mesos и Zookeeper.

Автор
0 · 0 отзывов

Отзывов пока нет. Будьте первым!

Ещё интересные курсы

P
Можно купить
100 ₽ 700 ₽ −86%

Python+Django. Графики и диаграммы

Udemy
Продуктовая аналитика Можно купить
626 ₽ 39 500 ₽ −98%

Продуктовая аналитика

GeekBrains
П
Можно купить
138 ₽ 880 ₽ −84%

Продвинутые модели прогнозирования с Python

D
Можно купить
134 ₽ 1 499 ₽ −91%

Data Science на Python 3 с нуля

YouRa Allakhverdov
Qlik Sense Certification - The Complete Practical Course Можно купить
462 ₽ 1 500 ₽ −69%

Qlik Sense Certification - The Complete Practical Course

Paul Scotchford
Сертифицированный аналитик данных начального уровня с Python (PCED) Можно купить
198 ₽ 2 490 ₽ −92%

Сертифицированный аналитик данных начального уровня с Python (PCED)

Paweł Krakowiak