Gegevens met studentenscores extraheren, transformeren en laden
Oké, tijd om je eigen ETL-pijplijn vanaf nul te bouwen. In deze oefening maak je drie functies: extract(), transform() en load(). Daarna gebruik je deze functies om je pijplijn te draaien.
De bibliotheek pandas is geïmporteerd als pd. Succes!
Deze oefening maakt deel uit van de cursus
ETL en ELT in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
def extract(file_name):
# Read a CSV with a path stored using file_name into memory
return pd.____(file_name)