1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Working with Hugging Face

Connected

cvičení

Manipulace s datasetem

Před použitím datasetu v ML úloze ho budeš často potřebovat nejprve upravit. Dvě běžné operace jsou filtrování a výběr (tzv. slicing). Kvůli velikosti datasetů využívá Hugging Face formát arrow.

To znamená, že manipulace probíhají trochu jinak, než na co jsi možná zvyklý/á. Naštěstí už na to existují hotové metody!

Dataset je pro tebe načtený pod proměnnou wikipedia.

Pokyny 1/2

undefined XP
    1
    2
  • Filtruj dataset na řádky obsahující výraz "football" ve sloupci text a ulož výsledek jako filtered.
  • Vyber jeden záznam z filtrovaného datasetu a ulož ho jako example.