Modernizing Data Lakes and Data Warehouses with GCP en Français

  • 0.0
Approx. 8 hours to complete

Course Summary

In this course, you will learn about data lakes and data warehouses on the Google Cloud Platform (GCP), and how to build and manage them using tools such as BigQuery, Cloud Dataflow, and Cloud Dataproc.

Key Learning Points

  • Understand the differences between data lakes and data warehouses
  • Learn how to build and manage data lakes and data warehouses on GCP
  • Get hands-on experience with tools such as BigQuery, Cloud Dataflow, and Cloud Dataproc

Job Positions & Salaries of people who have taken this course might have

    • USA: $91,000
    • India: ₹6,00,000
    • Spain: €45,000
    • USA: $91,000
    • India: ₹6,00,000
    • Spain: €45,000

    • USA: $61,000
    • India: ₹4,00,000
    • Spain: €32,000
    • USA: $91,000
    • India: ₹6,00,000
    • Spain: €45,000

    • USA: $61,000
    • India: ₹4,00,000
    • Spain: €32,000

    • USA: $118,000
    • India: ₹9,00,000
    • Spain: €60,000

Related Topics for further study


Learning Outcomes

  • Ability to understand the differences between data lakes and data warehouses
  • Ability to build and manage data lakes and data warehouses on GCP
  • Hands-on experience with tools such as BigQuery, Cloud Dataflow, and Cloud Dataproc

Prerequisites or good to have knowledge before taking this course

  • Basic knowledge of SQL
  • Familiarity with GCP

Course Difficulty Level

Intermediate

Course Format

  • Online self-paced course
  • Video lectures
  • Hands-on exercises

Similar Courses

  • Data Engineering on Google Cloud Platform
  • Data Analysis on Google Cloud Platform

Related Education Paths


Notable People in This Field

  • Data Scientist
  • Engineer

Related Books

Description

Les deux principaux composants de tout pipeline de données sont les lacs de données et les entrepôts de données. Ce cours aborde les cas d'utilisation de chacun de ces systèmes de stockage, et présente en détail les solutions disponibles sur Google Cloud Platform. Il décrit également le rôle de Data Engineer et les atouts des pipelines de données pour l'entreprise, en plus d'expliquer l'intérêt de l'environnement cloud pour l'ingénierie de données. Vous vous familiariserez, dans le cadre d'exercices pratiques dans QwikLabs, aux concepts de lacs et d'entrepôts de données sur Google Cloud Platform.

Outline

  • Introduction
  • Présentation du cours
  • Premiers pas avec Google Cloud Platform et Qwiklabs
  • Data Engineering
  • Découvrir le rôle d'un ingénieur de données
  • Analyser les défis liés à l'ingénierie des données
  • Présentation de BigQuery
  • Lacs de données et entrepôts de données
  • Démo : Requêtes fédérées avec BigQuery
  • Bases de données transactionnelles et entrepôts de données
  • Travailler efficacement avec d'autres équipes de gestion des données
  • Gérer l'accès et la gouvernance des données
  • Démo : Trouver les informations personnelles dans votre ensemble de données avec l'API DLP
  • Créer des pipelines prêts à l'emploi
  • Réviser l'étude de cas GCP
  • Récapitulatif
  • Présentation de l'atelier : Analyser avec BigQuery
  • Introduction à Data Engineering
  • Créer un lac de données
  • Présentation des lacs de données
  • Stockage de données et options ETL sur GCP
  • Créer un lac de données avec Cloud Storage
  • Démo : Optimiser les coûts avec les classes Google Cloud Storage et Cloud Functions
  • Sécuriser Cloud Storage
  • Stocker des données de tous types
  • Démo : Exécuter des requêtes fédérées dans des fichiers Parquet et ORC dans BigQuery
  • Stocker des données relationnelles dans le cloud
  • Cloud SQL en tant que lac de données relationnelles
  • Atelier : Charger les données des taxis dans Cloud SQL
  • Créer un lac de données
  • Créer un entrepôt de données
  • L'entrepôt de données moderne
  • Présentation de BigQuery
  • Démo : Interroger des téraoctets de données en quelques secondes
  • Premiers pas
  • Charger des données
  • Présentation de l'atelier : Charger des données dans BigQuery
  • Explorer les schémas
  • Démo : Explorer les schémas
  • Conception de schémas
  • Champs imbriqués et répétés
  • Démo : Champs imbriqués et répétés
  • Présentation de l'atelier : Utiliser les données JSON et Array dans BigQuery
  • Optimiser avec le partitionnement et le clustering
  • Démo : Créer des tables partitionnées
  • Démo : Partitionnement et clustering
  • Aperçu : Transformer les données par lots et les flux de données
  • Récapitulatif
  • Créer un entrepôt de données
  • Résumé
  • Résumé du cours

Summary of User Reviews

Discover the world of data lakes and data warehouses on GCP with this course. Students love the practical approach to learning and the real-world examples provided.

Key Aspect Users Liked About This Course

Real-world examples

Pros from User Reviews

  • Practical approach to learning
  • Great real-world examples
  • Good pace and structure
  • Instructors are knowledgeable and engaging
  • Materials are well-organized and easy to follow

Cons from User Reviews

  • Some technical issues with the platform
  • Not enough hands-on exercises
  • Lacks depth in certain areas
  • Some topics are rushed through
  • Course can be too basic for advanced learners
French
Available now
Approx. 8 hours to complete
Google Cloud Training
Google Cloud
Coursera
Share
Saved Course list
Cancel
Get Course Update
Computer Courses