Erste SchritteKostenlos loslegen

Bereitstellen einer ETL Pipeline auf Kubernetes

Du wirst eine ETL Pipeline auf Kubernetes bereitstellen. Deine Extraktions-, Transformations- und Ladeschritte werden von Pods ausgeführt, die in die jeweiligen Persistent Volumes lesen und schreiben, die Persistent Volume Claims erstellen.

Deine Aufgabe ist es, die Gesamtzahl der Fahrgäste zu ermitteln, die ein gelbes Taxi von NYC als Gruppe von 2 oder mehr Personen genommen haben. Dein "Extract Pod" bereitet die Ausgangsdaten als CSV Datei vor und übergibt sie an den "Transform Pod". Dieser Pod verfeinert die Daten der gelben Taxis in einer SQLite Datenbank und wählt alle Daten aus, die für die endgültige Berechnung notwendig sind, und übergib ihn an den "Load Pod". Dieser letzte Pod summiert alle Passagierdaten, präsentiert sie und speichert sie als CSV Datei.

Alle diese Schritte werden mit den dir bekannten Standard-Kubernetes-Objekten durchgeführt. Es wurden zwei Verzeichnisse vorbereitet, "Docker/" und "Manifests/", die die notwendigen Dateien enthalten, um die Docker-Images zu erstellen und sie mit Kubernetes zu verteilen.

Diese Übung ist Teil des Kurses

Einführung in Kubernetes

Kurs anzeigen

Interaktive Übung zum Anfassen

Setzen Sie die Theorie mit einer unserer interaktiven Übungen in die Tat um

Beginnen Sie mit dem Training