Aan de slagBegin gratis

Mergen met PySpark

In deze oefening uploaden we drie bestanden naar een lakehouse die samen een snowflake-dimensie voor videogames vormen: videogames in één bestand, genres in het tweede bestand en uitgevers in het derde bestand. We willen deze samenvoegen tot één tabel met PySpark om de join uit te voeren.

Opmerking: Krijg je een foutmelding over een API-snelheidslimiet? Dit gebeurt meestal omdat een eerdere Fabric-taak nog niet is voltooid. Je kunt actieve Fabric-taken bekijken op de pagina Monitor (in het verticale menu links). Het annuleren van oude Fabric-taken op de pagina Monitor lost de snelheidslimietfout meestal op.

Deze oefening maakt deel uit van de cursus

Gegevens transformeren en analyseren met Microsoft Fabric

Bekijk cursus

Interactieve oefening met praktijkervaring

Zet theorie om in actie met een van onze interactieve oefeningen

Begin oefening