Udemy, Frank Kane | Taming Big Data with Apache Spark and Python - Hands On! (2020) PCRec [En / En Sub]
Автор: Frank Kane
Производство: UdemyЖанр: Программирование
Описание:Новинка! Обновлено для Spark 3, больше практических упражнений и усиление внимания к DataFrames и структурированной потоковой передаче.
Анализ «Big Data» - это актуальный и очень ценный навык, и этот курс научит вас самой популярной технологии в области больших данных: Apache Spark. Работодатели, включая Amazon, EBay, NASA JPL и Yahoo, все используют Spark для быстрого извлечения смысла из массивных данных. настраивается в отказоустойчивом кластере Hadoop. Вы изучите те же методы, используя свою собственную систему Windows прямо у себя дома. Это проще, чем вы думаете.
Изучите и освоите искусство оформления проблем анализа данных в виде проблем Spark на более чем 20 практических примерах, а затем масштабируйте их для работы в службах облачных вычислений в этом курсе. Вы будете учиться у бывшего инженера и старшего менеджера из Amazon и IMDb.
- Изучите концепции Spark DataFrames и Resilient Distributed Datastores
- Быстро разрабатывать и запускать задания Spark с помощью Python
- Переводите сложные задачи анализа в итеративные или многоэтапные скрипты Spark
- Масштабирование до больших наборов данных с помощью сервиса Amazon Elastic MapReduce
- Понять, как Hadoop YARN распределяет Spark по вычислительным кластерам
- Узнайте о других технологиях Spark, таких как Spark SQL, Spark Streaming и GraphX.
К концу этого курса вы будете запускать код, анализирующий гигабайты информации - в облаке - за считанные минуты. В этом курсе используется знакомый язык программирования Python.
Продолжительность: 06:54:21
Качество видео: PCRec
Язык озвучки: Английский
Скриншоты:
Время раздачи: 24/7 (до появления первых 3-5 скачавших)