Brij Kishore Pandey, Emily Ro Schoof | Building ETL Pipelines with Python (2023) [PDF][EN]
Автор: Brij Kishore Pandey, Emily Ro Schoof
Издательство: Packt PublishingISBN: 978-1-80461-525-6
Жанр: Программирование
Язык: Английский
Формат: PDF
Качество: Изначально электронное (ebook)
Иллюстрации: Цветные и черно-белые
Описание:В этой книге вы пройдете через весь процесс разработки ETL-конвейера данных, начиная с введения в основы конвейеров данных и создания среды разработки Python для создания конвейеров. Изучив принципы построения ETL-конвейеров и процесс разработки ET, вы будете готовы к проектированию пользовательских ETL-конвейеров. Далее вы познакомитесь с этапами процесса ETL, который включает в себя извлечение ценных данных, их преобразование, очистку, манипулирование и обеспечение целостности данных, а также загрузку обработанных данных в системы хранения. Вы также рассмотрите несколько модулей ETL на языке Python, сравните их преимущества и недостатки при построении конвейеров данных и использовании облачных инструментов, таких как AWS, для создания масштабируемых конвейеров данных.
Скриншоты:
Время раздачи: 24/7 (минимум до появления первых 3-5 скачавших)