Gegevens filteren met PySpark
In deze oefening uploaden we een bestand naar een lakehouse en gebruiken we PySpark om gegevens te filteren. Het bestand bevat een lijst met videogames en hun uitgevers. We willen de gegevensset verkleinen zodat we alleen werken met videogames van uitgever Atari.
Opmerking: Krijg je een foutmelding over een API-snelheidslimiet, dan komt dat meestal doordat een eerdere Fabric-taak nog niet is afgerond. Je kunt actieve Fabric-taken bekijken op de pagina Monitor (links in het verticale menu). Het annuleren van oude Fabric-taken op de Monitor-pagina lost de snelheidslimietfout meestal op.
Deze oefening maakt deel uit van de cursus
Gegevens transformeren en analyseren met Microsoft Fabric
Praktische interactieve oefening
Zet theorie om in actie met een van onze interactieve oefeningen.
Begin met trainen