TrueschoTruescho
All Courses
Batch Data Pipelines on Google Cloud
Coursera
Course
Unknown

Batch Data Pipelines on Google Cloud

Google Cloud

This course explains batch data pipeline paradigms EL, ELT, and ETL, introduces Google Cloud technologies for data transformation, including BigQuery, Dataproc, and Data Fusion.

Unknown4 weeksSpanish

About this Course

Las canalizaciones de datos suelen realizarse según uno de los paradigmas extracción y carga (EL); extracción, carga y transformación (ELT), o extracción, transformación y carga (ETL). En este curso, abordaremos qué paradigma se debe utilizar para los datos por lotes y cuándo corresponde usarlo. Además, veremos varias tecnologías de Google Cloud para la transformación de datos, incluidos BigQuery, la ejecución de Spark en Dataproc, grafos de canalización en Cloud Data Fusion y procesamiento de d

What You'll Learn

  • Review EL, ELT, and ETL data loading methods and their use cases
  • Run Hadoop on Dataproc, utilize Cloud Storage, and optimize Dataproc jobs
  • Build data pipelines for data processing with Dataflow
  • Manage data pipelines using Data Fusion and Cloud Composer

Prerequisites

  • Basic understanding of big data concepts
  • Knowledge of data storage concepts
  • Some experience with cloud computing platforms

Instructors

G

Google Cloud Training

Topics

Performance Tuning
Data Transformation
Data Integration
Data Quality
Google Cloud Platform
Extract, Transform, Load
Data Processing
Data Pipelines
Apache Spark
Data Warehousing

Course Info

PlatformCoursera
LevelUnknown
PacingUnknown
PriceFree

Skills

تحسين الأداء
تحويل البيانات
تكامل البيانات
جودة البيانات
منصة جوجل كلاود
استخراج وتحويل وتحميل
معالجة البيانات
تدفقات البيانات
Apache Spark
Data Warehousing

Start Learning Now