1. Apprendre
  2. /
  3. Cours
  4. /
  5. Travailler avec Hugging Face

Connected

Exercice

Manipuler des jeux de données

Il est probable que vous deviez souvent manipuler un jeu de données avant de l'utiliser dans une tâche de ML. Deux manipulations courantes sont le filtrage et la sélection (ou la tranche). Vu la taille de ces jeux de données, Hugging Face s'appuie sur des types de fichiers Arrow.

Cela signifie que les manipulations se font un peu différemment de ce à quoi vous êtes peut-être habitué. Heureusement, il existe déjà des méthodes pour vous aider!

Le jeu de données est déjà chargé sous wikipedia.

Instructions 1/2

undefined XP
    1
    2
  • Filtrez le jeu de données pour les lignes contenant le terme "football" dans la colonne text et enregistrez le résultat sous filtered.
  • Sélectionnez un seul exemple du jeu de données filtré et enregistrez-le sous example.