CommencerCommencer gratuitement

Filtrage de données avec PySpark

Dans cet exercice, vous allez téléverser un fichier dans un lakehouse et utiliser PySpark pour filtrer des données. Le fichier contient une liste de jeux vidéo et leurs éditeurs. Nous voulons réduire le jeu de données pour ne conserver que les jeux vidéo de l’éditeur Atari.

Remarque : si vous obtenez une erreur liée à une limite de débit d’API, cela se produit généralement parce qu’une tâche Fabric précédente n’est pas terminée. Vous pouvez consulter les tâches Fabric actives depuis la page Monitor (dans le menu vertical de gauche). L’annulation des anciennes tâches Fabric dans la page Monitor résout généralement cette erreur de limite.

Cet exercice fait partie du cours

Transformer et analyser des données avec Microsoft Fabric

Afficher le cours

Exercice interactif pratique

Passez de la théorie à la pratique avec l’un de nos exercices interactifs

Commencer l’exercice