From Data to Insights with Google Cloud Platform (DIGCP) – Details

Detaillierter Kursinhalt

Modul 1: Einführung in Daten auf der Google Cloud Platform
  • Hervorhebung von Analytics-Herausforderungen für Datenanalysten
  • Vergleich von Big Data vor Ort mit Big Data in der Cloud
  • Erläuterung realer Anwendungsfälle von Unternehmen, die durch Analytics in der Cloud eine Transformation durchlaufen haben
  • Projektgrundlagen von Google Cloud Platform
  • Lab: Erste Schritte mit Google Cloud Platform
Modul 2: Überblick über Big-Data-Tools
  • Anleitung für die Aufgaben und Herausforderungen von Datenanalysten und Einführung in die Datentools der Google Cloud Platform
  • Demo: 10 Milliarden Datensätze mit Google BigQuery analysieren
  • 9 grundlegende Funktionen in Google BigQuery untersuchen
  • GCP-Tools für Analysten, Data Scientists und Data Engineers vergleichen
  • Lab: Datasets mit Google BigQuery untersuchen
Modul 3: Daten mit SQL erkunden
  • Gängige Techniken der Datenexploration vergleichen
  • Qualitativ hochwertiges Standard-SQL codieren
  • Öffentliche Datasets von Google BigQuery untersuchen
  • Vorschau der Visualisierung: Google Data Studio
  • Lab: Gängige SQL-Fehler beheben
Modul 4: Preisgestaltung von Google BigQuery
  • Anleitung für einen Job in BigQuery
  • Preise von BigQuery berechnen: Kosten für Speicherung, Abfrage und Streaming
  • Abfragen nach Kosten optimieren
  • Lab: Preise von Google BigQuery berechnen
Modul 5: Daten bereinigen und transformieren
  • Die fünf Prinzipien der Integrität von Datasets
  • Dataset-Form und -Verzerrung charakterisieren
  • Daten mit SQL bereinigen und transformieren
  • Daten mit neuer UI bereinigen und transformieren: Einführung in Cloud Dataprep
  • Lab: Daten mit Cloud Dataprep untersuchen und gestalten
Modul 6: Daten speichern und exportieren
  • Permanente und temporäre Tabellen vergleichen
  • Abfrageergebnisse speichern und exportieren
  • Leistungsvorschau: Abfragecache
  • Lab: Neue permanente Tabellen erstellen
Modul 7: Neue Datasets in Google BigQuery aufnehmen
  • Externe Datenquellen abfragen
  • Probleme bei der Datenaufnahme vermeiden
  • Neue Daten in permanente Tabellen aufnehmen
  • Streaming-Insert-Anweisungen diskutieren
  • Lab: Neue Datasets aufnehmen und abfragen
Modul 8: Datenvisualisierung
  • Übersicht zu den Prinzipien der Datenvisualisierung
  • Exploratorischer und erklärender Analyseansatz im Vergleich
  • Demo: UI von Google Data Studio
  • Google Data Studio und Google BigQuery verbinden
  • Lab: Dataset in Google Data Studio untersuchen
Modul 9: Datasets verbinden und zusammenführen
  • Verlaufsdatentabellen mit UNION zusammenführen
  • Einführung in Tabellenplatzhalter für einfache Zusammenführungen
  • Datenschemata überprüfen: Daten über mehrere Tabellen hinweg verknüpfen
  • Anleitung zu JOIN-Beispielen und Problemen
  • Lab: Daten aus mehreren Tabellen verbinden und zusammenführen
Modul 10: Fortgeschrittene Funktionen und Klauseln
  • SQL-Fallanweisungen überprüfen
  • Einführung in analytische Fensterfunktionen
  • Datensicherung mit unidirektionaler Feldverschlüsselung
  • Effektives Design für Unterabfragen und CTE
  • SQL- und JavaScript-UDFs im Vergleich
  • Lab: Mit erweiterten SQL-Funktionen Erkenntnisse ableiten
Modul 11: Schemadesign und verschachtelte Datenstrukturen
  • Google BigQuery und herkömmliche RDBMS-Datenarchitekturen im Vergleich
  • Normalisierung und Denormalisierung im Vergleich: Leistungskompromisse
  • Schemaüberprüfung: Gute und schlechte Schemata
  • Arrays und verschachtelte Daten in Google BigQuery
  • Lab: Verschachtelte und wiederkehrende Daten abrufen
Modul 12: Mehr Visualisierung mit Google Data Studio
  • Fallanweisungen und berechnete Felder erstellen
  • Überlegungen zum Cache und der Vermeidung von Leistungsproblemen
  • Dashboards teilen und Überlegungen zum Datenzugriff diskutieren
Modul 13: Leistungsoptimierung
  • Leistungsprobleme von Google BigQuery vermeiden
  • Hotspots in Ihren Daten verhindern
  • Mit der Query Explanation Map Leistungsprobleme diagnostizieren
  • Lab: Abfrageleistung optimieren und Fehler beheben
Modul 14: Datenzugriff
  • Dataset-Rollen in IAM und BigQuery im Vergleich
  • Zugriffsprobleme vermeiden
  • Mitglieder, Rollen, Organisationen, Kontoverwaltung und Dienstkonten überprüfen
Modul 15: Notebooks in der Cloud
  • Cloud Datalab
  • Compute Engine und Cloud Storage
  • Lab: VM zum Verarbeiten von Erdbebendaten mieten
  • Datenanalyse mit BigQuery
Modul 16: Maschinelles Lernen bei Google
  • Einführung in maschinelles Lernen für Analysten
  • Mit vortrainierten ML APIs für Bild- und Textverständnis üben
  • Lab: Vortrainierte ML APIs
Modul 17: Maschinelles Lernen auf Ihre Datasets anwenden (BQML)
  • ML-Datasets erstellen und Merkmale analysieren
  • Modelle für die Klassifizierung und Prognose mit BQML erstellen
  • Lab: Kaufverhalten von Websitebesuchern mit einem Klassifizierungsmodell in BQML vorhersagen
  • Lab: Taxikosten mit einem ML-Prognosemodell in BigQuery vorhersagen