Réaliser une agrégation de données
Dans cet exercice, nous allons téléverser un fichier dans un lakehouse et utiliser PySpark pour agréger des données. Le fichier contient une liste de jeux vidéo et leurs éditeurs. Nous voulons produire une table récapitulative indiquant, pour chaque éditeur, le nombre de jeux et la note moyenne des critiques.
Remarque : si vous obtenez une erreur liée à une limite de débit d’API, c’est généralement qu’une tâche Fabric précédente n’est pas terminée. Vous pouvez consulter les tâches actives depuis la page Monitor (dans le menu vertical de gauche). L’annulation des anciennes tâches Fabric dans la page Monitor résout en général ce problème de limite.
Cet exercice fait partie du cours
Transformer et analyser des données avec Microsoft Fabric
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
Commencer l’exercice