1. Learn
  2. /
  3. Cursuri
  4. /
  5. Lucrul cu Hugging Face

Connected

exercițiu

Manipularea seturilor de date

În multe situații, va trebui să manipulezi un set de date înainte de a-l folosi într-o sarcină de învățare automată. Două operații frecvente sunt filtrarea și selectarea (sau decuparea). Datorită dimensiunii acestor seturi de date, Hugging Face utilizează formatul de fișiere Arrow.

Aceasta înseamnă că manipulările se realizează ușor diferit față de ce ești obișnuit. Din fericire, există deja metode care te ajută cu asta!

Setul de date este deja încărcat sub numele wikipedia.

Instrucțiuni 1/2

undefined XP
    1
    2
  • Filtrează setul de date pentru rândurile care conțin termenul "football" în coloana text și salvează rezultatul ca filtered.
  • Selectează un singur exemplu din setul de date filtrat și salvează-l ca example.