Работа с терабайтами информации требует иных инструментов, чем обычные таблицы Excel — этот курс показывает, как адаптировать язык R для обработки массивов данных в инфраструктурах Hadoop, Spark и SQL Server. Вы разберете, как масштабировать аналитические скрипты, чтобы они не зависели от ограничений оперативной памяти локального компьютера. Особое внимание уделено параллельным вычислениям, очистке «сырых» данных и развертыванию предиктивных моделей непосредственно внутри корпоративных сред хранения. Программа ориентирована на специалистов по анализу данных и разработчиков, работающих с высоконагруженными системами, и позволяет перенести процессы моделирования из локальных R-скриптов в промышленную эксплуатацию.
Отзывов пока нет. Будьте первым!