Name: Building Batch Data Analytics Solutions on AWS
Price: 750 EUR

Building Batch Data Analytics Solutions on AWS (BBDAS)

Kursüberblick

In diesem Kurs lernen Sie die Erstellung von Batch-Datenanalyselösungen mit Amazon EMR, einem verwalteten Apache Spark- und Apache Hadoop-Service der Enterprise-Klasse. Sie lernen, wie Amazon EMR mit Open-Source-Projekten wie Apache Hive, Hue und HBase und mit AWS-Services wie AWS Glue und AWS Lake Formation integriert wird. Der Kurs behandelt die Komponenten Datenerfassung, -aufnahme, -katalogisierung, -speicherung und -verarbeitung im Kontext von Spark und Hadoop. Sie lernen die Verwendung von EMR Notebooks zur Unterstützung von Analyse- und Machine Learning-Arbeitslasten. Sie werden auch lernen, die besten Praktiken für Sicherheit, Leistung und Kostenmanagement auf den Betrieb von Amazon EMR anzuwenden.

Dieser Text wurde automatisiert übersetzt. Um den englischen Originaltext anzuzeigen, klicken Sie bitte hier.

Zielgruppe

Dieser Kurs richtet sich an:

Ingenieure für Datenplattformen
Architekten und Betreiber, die Datenanalyse-Pipelines aufbauen und verwalten

Zertifizierungen

Empfohlenes Training für die Zertifizierung zum:

AWS Certified Data Engineer - Associate

Voraussetzungen

Teilnehmer mit mindestens einem Jahr Erfahrung im Umgang mit Open-Source-Datenframeworks wie Apache Spark oder Apache Hadoop profitieren von diesem Kurs.

Kursziele

In diesem Kurs werden Sie lernen:

Vergleichen Sie die Funktionen und Vorteile von Data Warehouses, Data Lakes und modernen Datenarchitekturen
Entwurf und Implementierung einer Lösung für die Batch-Datenanalyse
Identifizierung und Anwendung geeigneter Techniken, einschließlich Komprimierung, zur Optimierung der Datenspeicherung
Auswahl und Einsatz geeigneter Optionen zur Aufnahme, Umwandlung und Speicherung von Daten
Auswahl der geeigneten Instanz- und Knotentypen, Cluster, der automatischen Skalierung und der Netzwerktopologie für einen bestimmten geschäftlichen Anwendungsfall
Verstehen, wie sich Datenspeicherung und -verarbeitung auf die Analyse- und Visualisierungsmechanismen auswirken, die für die Gewinnung verwertbarer Geschäftseinblicke erforderlich sind
Sichere Daten im Ruhezustand und bei der Übertragung
Überwachen von Analyse-Workloads, um Probleme zu erkennen und zu beheben
Anwendung bewährter Kostenmanagementverfahren

Kursinhalt

Modul A: Überblick über Datenanalyse und die Datenpipeline

Anwendungsfälle der Datenanalyse
Nutzung der Datenpipeline für Analysen

Modul 1: Einführung in Amazon EMR

Verwendung von Amazon EMR in Analyselösungen
Amazon EMR-Cluster-Architektur
Interaktive Demo 1: Starten eines Amazon EMR-Clusters
Strategien für das Kostenmanagement

Modul 2: Datenanalyse-Pipeline mit Amazon EMR: Ingestion und Speicherung

Speicheroptimierung mit Amazon EMR
Techniken für die Datenübernahme

Modul 3: Leistungsstarke Batch-Datenanalyse mit Apache Spark auf Amazon EMR

Apache Spark auf Amazon EMR Anwendungsfälle
Warum Apache Spark auf Amazon EMR
Spark-Konzepte
Interaktive Demo 2: Verbinden mit einem EMR-Cluster und Ausführen von Scala-Befehlen mit der Spark-Shell
Umwandlung, Verarbeitung und Analyse
Verwendung von Notebooks mit Amazon EMR
Praxisübung 1: Datenanalyse mit niedriger Latenz mit Apache Spark auf Amazon EMR

Modul 4: Verarbeitung und Analyse von Batch-Daten mit Amazon EMR und Apache Hive

Verwendung von Amazon EMR mit Hive zur Verarbeitung von Stapeldaten
Umwandlung, Verarbeitung und Analyse
Praxisübung 2: Batch-Datenverarbeitung mit Amazon EMR und Hive
Einführung in Apache HBase auf Amazon EMR

Modul 5: Serverlose Datenverarbeitung

Serverlose Datenverarbeitung, -umwandlung und -analyse
Verwendung von AWS Glue mit Amazon EMR-Arbeitslasten
Praxisübung 3: Orchestrierung der Datenverarbeitung in Spark mit AWS Step Functions

Modul 6: Sicherheit und Überwachung von Amazon EMR-Clustern

Sicherung von EMR-Clustern
Interaktive Demo 3: Client-seitige Verschlüsselung mit EMRFS
Überwachung und Fehlerbehebung von Amazon EMR-Clustern
Demo: Überprüfung der Apache Spark-Cluster-Historie

Modul 7: Entwurf von Batch Data Analytics-Lösungen

Anwendungsfälle der Batch-Datenanalyse
Tätigkeit: Entwurf eines Arbeitsablaufs für die Batch-Datenanalyse

Modul B: Entwicklung von modernen Datenarchitekturen auf AWS

Moderne Datenarchitekturen

Preise & Trainingsmethoden

Online Training

Dauer
1 Tag

Preis

750,– €

Termine und Buchen

Termin anfragen

Classroom Training

Dauer
1 Tag

Preis

Österreich: 750,– €
Deutschland: 750,– €
Schweiz: CHF 870,–

inkl. Verpflegung

Termine und Buchen

Termin anfragen

Instructor-led Online Training: Kursdurchführung online im virtuellen Klassenraum.

Deutsch

Europäische Zeitzonen

21.07.2026 Online Training Kurssprache: Deutsch

13.10.2026 Online Training Kurssprache: Deutsch

03.11.2026 Online Training Kurssprache: Deutsch

17.03.2027 Online Training Kurssprache: Deutsch

Englisch

Europäische Zeitzonen

22.07.2026 Online Training Kurssprache: Englisch

14.10.2026 Online Training Kurssprache: Englisch

7 Stunden Differenz zu Mitteleuropäische Sommerzeit (MESZ)

02.11.2026 Online Training Zeitzone: Central Standard Time (CST) Kurssprache: Englisch

9 Stunden Differenz zu Mitteleuropäische Sommerzeit (MESZ)

03.08.2026 Online Training Zeitzone: Pacific Daylight Time (PDT) Kurssprache: Englisch

Französisch

Europäische Zeitzonen

20.11.2026 Online Training Kurssprache: Französisch

Italienisch

Europäische Zeitzonen

28.07.2026 Online Training Kurssprache: Italienisch

13.10.2026 Online Training Kurssprache: Italienisch

24.11.2026 Online Training Kurssprache: Italienisch

Afrika

Ägypten

21.06.2026 Kairo Kurssprache: Englisch

30.08.2026 Kairo Kurssprache: Englisch

22.11.2026 Kairo Kurssprache: Englisch

Mittlerer Osten

Saudi-Arabien

27.07.2026 Riad Kurssprache: Englisch

05.10.2026 Riad Kurssprache: Englisch

Vereinigte Arabische Emirate

27.07.2026 Dubai Kurssprache: Englisch

05.10.2026 Dubai Kurssprache: Englisch

Preis (exkl. MwSt.)

Preis (exkl. MwSt.)

Building Batch Data Analytics Solutions on AWS (BBDAS)

Kursüberblick

Zielgruppe

Zertifizierungen

Voraussetzungen

Kursziele

Kursinhalt

Modul A: Überblick über Datenanalyse und die Datenpipeline

Modul 1: Einführung in Amazon EMR

Modul 2: Datenanalyse-Pipeline mit Amazon EMR: Ingestion und Speicherung

Modul 3: Leistungsstarke Batch-Datenanalyse mit Apache Spark auf Amazon EMR

Modul 4: Verarbeitung und Analyse von Batch-Daten mit Amazon EMR und Apache Hive

Modul 5: Serverlose Datenverarbeitung

Modul 6: Sicherheit und Überwachung von Amazon EMR-Clustern

Modul 7: Entwurf von Batch Data Analytics-Lösungen

Modul B: Entwicklung von modernen Datenarchitekturen auf AWS

Preise & Trainingsmethoden

Online Training

Preis

Classroom Training

Preis

Kurstermine

Deutsch

Europäische Zeitzonen

Englisch

Europäische Zeitzonen

7 Stunden Differenz zu Mitteleuropäische Sommerzeit (MESZ)

9 Stunden Differenz zu Mitteleuropäische Sommerzeit (MESZ)

Französisch

Europäische Zeitzonen

Italienisch

Europäische Zeitzonen

Afrika

Ägypten

Mittlerer Osten

Saudi-Arabien

Vereinigte Arabische Emirate