Big Data для Data Science

0/5 ·
Создан: 29 января 2020 г. Обновлён: 23 марта 2026 г.

Вам больше не придется ограничиваться локальными объемами данных: этот курс учит переносить задачи анализа на распределенные системы Hadoop и Spark. Здесь разбирают, как эффективно обрабатывать терабайты информации, настраивать ETL-процессы и строить архитектуру хранилищ, когда возможностей стандартного Pandas становится недостаточно. Внутри — работа с NoSQL-базами (HBase, Cassandra, ClickHouse), управление задачами через Apache Airflow и внедрение машинного обучения в инфраструктуру Big Data с помощью Spark ML. В результате вы научитесь готовить данные для DS-моделей в масштабах больших компаний и визуализировать результаты в Apache Superset.

0 · 0 отзывов

Отзывов пока нет. Будьте первым!

Ещё интересные курсы

A
Можно купить
218 ₽ 670 ₽ −67%

All NoSQL (HBase + Cassandra + MongoDB + Redis) for Big Data

Udemy
Первичный анализ данных в Python. Часть 1 Можно купить
476 ₽ 22 750 ₽ −98%

Первичный анализ данных в Python. Часть 1

МФТИ
Н
Можно купить
280 ₽ 999 ₽ −72%

Несложно о сложных сетях

Dmitry Zinoviev
Алгоритмы для разработчиков. Часть 2 из 4 Можно купить
370 ₽ 10 400 ₽ −96%

Алгоритмы для разработчиков. Часть 2 из 4

Яндекс Практикум
Конференция по проектированию промышленных ИТ-систем Сбор взносов
326 ₽ 9 000 ₽ −96%

Конференция по проектированию промышленных ИТ-систем

Systems.Education
Анализ данных в KNIME Можно купить
98 ₽ 500 ₽ −80%

Анализ данных в KNIME

Игорь Ким
Подписка на библиотеку O'Reilly Предзаказ
3 451 ₽ 43 892 ₽ −92%

Подписка на библиотеку O'Reilly

O'Reilly
SQL для начинающих. Часть 3 Можно купить
106 ₽ 550 ₽ −81%

SQL для начинающих. Часть 3

Hayk Inants