Serverless Data Processing with Dataflow (SDPF)

 

Kursüberblick

Diese Schulung richtet sich an Big-Data-Experten, die ihr Verständnis von Dataflow vertiefen möchten, um ihre Datenverarbeitungsanwendungen voranzubringen. Beginnend mit den Grundlagen wird erklärt, wie Apache Beam und Dataflow zusammenarbeiten, um Ihre Datenverarbeitungsanforderungen zu erfüllen, ohne das Risiko einer Anbieterbindung einzugehen. Der Abschnitt über die Entwicklung von Pipelines behandelt, wie Sie Ihre Geschäftslogik in Datenverarbeitungsanwendungen umwandeln, die auf Dataflow laufen können. Die Schulung endet mit einem Schwerpunkt auf dem Betrieb, in dem die wichtigsten Lektionen für den Betrieb einer Datenanwendung auf Dataflow, einschließlich Überwachung, Fehlerbehebung, Testen und Zuverlässigkeit, behandelt werden.

Dieser Text wurde automatisiert übersetzt. Um den englischen Originaltext anzuzeigen, klicken Sie bitte hier.

Zielgruppe

  • Dateningenieure.
  • Datenanalysten und Datenwissenschaftler, die ihre Fähigkeiten im Bereich Data Engineering ausbauen möchten

Voraussetzungen

Um diesen Kurs optimal nutzen zu können, sollten die Teilnehmer die folgenden Kurse absolviert haben:

  • Building Batch Data Pipelines
  • Building Resilient Streaming Analytics Systems

Kursziele

  • Zeigen Sie, wie Apache Beam und Dataflow zusammenarbeiten, um die Datenverarbeitungsanforderungen Ihres Unternehmens zu erfüllen.
  • Fassen Sie die Vorteile des Beam Portability Frameworks zusammen und aktivieren Sie es für Ihre Dataflow-Pipelines.
  • Aktivieren Sie Shuffle und Streaming Engine für Batch- bzw. Streaming-Pipelines, um maximale Leistung zu erzielen.
  • Ermöglichen Sie eine flexible Ressourcenplanung für eine kosteneffizientere Leistung.
  • Wählen Sie die richtige Kombination von IAM-Berechtigungen für Ihren Dataflow-Auftrag.
  • Umsetzung bewährter Verfahren für eine sichere Datenverarbeitungsumgebung.
  • Wählen Sie die E/A Ihrer Wahl für Ihre Dataflow-Pipeline aus und stimmen Sie sie ab.
  • Verwenden Sie Schemata, um Ihren Beam-Code zu vereinfachen und die Leistung Ihrer Pipeline zu verbessern.
  • Entwickeln Sie eine Beam-Pipeline mit SQL und DataFrames.
  • Überwachung, Fehlerbehebung, Tests und CI/CD für Dataflow-Pipelines.

Preise & Trainingsmethoden

Online Training

Dauer
3 Tage

Preis
  • 1.950,– €
Classroom Training

Dauer
3 Tage

Preis
  • Österreich: 1.950,– €
  • Deutschland: 1.950,– €
  • Schweiz: CHF 2.220,–
 

Kurstermine

Instructor-led Online Training:   Kursdurchführung online im virtuellen Klassenraum.

Englisch

7 Stunden Differenz

Online Training Zeitzone: Central Daylight Time (CDT)
Online Training Zeitzone: Central Daylight Time (CDT)
Online Training 2 Tage Zeitzone: Central Daylight Time (CDT)
Online Training 2 Tage Zeitzone: Central Daylight Time (CDT)