Effettua il deploy di una pipeline ETL su Kubernetes
Effettuerai il deploy di una pipeline ETL su Kubernetes. Le fasi di Extract, Transform e Load saranno realizzate da Pod, che leggono e scrivono sui rispettivi Persistent Volume creati da Persistent Volume Claim.
Il tuo compito è trovare il numero totale di passeggeri che hanno preso un taxi giallo di NYC in gruppi di 2 o più persone. Il tuo "Extract Pod" preparerà i dati iniziali come file CSV e li passerà al "Transform Pod". Questo Pod rifinirà i dati dei yellow cab in un database SQLite, selezionerà tutti i dati necessari per il calcolo finale, e li passerà al "Load Pod". Questo Pod finale sommerà tutti i passeggeri, li mostrerà e li salverà come file CSV.
Tutti questi passaggi verranno eseguiti usando i classici oggetti Kubernetes che conosci. Sono state predisposte due directory, "Docker/" e "Manifests/", che contengono i file necessari per creare le immagini Docker e distribuirle con Kubernetes.
Questo esercizio fa parte del corso
Introduzione a Kubernetes
Esercizio pratico interattivo
Passa dalla teoria alla pratica con uno dei nostri esercizi interattivi
Inizia esercizio