Filtrage de données avec PySpark
Dans cet exercice, vous allez téléverser un fichier dans un lakehouse et utiliser PySpark pour filtrer des données. Le fichier contient une liste de jeux vidéo et leurs éditeurs. Nous voulons réduire le jeu de données pour ne conserver que les jeux vidéo de l’éditeur Atari.
Remarque : si vous obtenez une erreur liée à une limite de débit d’API, cela se produit généralement parce qu’une tâche Fabric précédente n’est pas terminée. Vous pouvez consulter les tâches Fabric actives depuis la page Monitor (dans le menu vertical de gauche). L’annulation des anciennes tâches Fabric dans la page Monitor résout généralement cette erreur de limite.
Cet exercice fait partie du cours
Transformer et analyser des données avec Microsoft Fabric
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
Commencer l’exercice