Aan de slagGa gratis aan de slag

Mergen met PySpark

In deze oefening uploaden we drie bestanden naar een lakehouse die samen een snowflake-dimensie voor videogames vormen: videogames in één bestand, genres in het tweede bestand en uitgevers in het derde bestand. We willen deze samenvoegen tot één tabel met PySpark om de join uit te voeren.

Opmerking: Krijg je een foutmelding over een API-snelheidslimiet? Dit gebeurt meestal omdat een eerdere Fabric-taak nog niet is voltooid. Je kunt actieve Fabric-taken bekijken op de pagina Monitor (in het verticale menu links). Het annuleren van oude Fabric-taken op de pagina Monitor lost de snelheidslimietfout meestal op.

Deze oefening maakt deel uit van de cursus

Gegevens transformeren en analyseren met Microsoft Fabric

Cursus bekijken

Praktische interactieve oefening

Zet theorie om in actie met een van onze interactieve oefeningen.

Begin met trainen