1. 学习
  2. /
  3. 课程
  4. /
  5. Hugging Face を使いこなす

Connected

练习

データセットの操作

MLタスクで使う前に、データセットを加工(操作)する必要がある場面は多くあります。よく使われる操作には、フィルタリングと選択(スライス)が含まれます。これらのデータセットは大規模なため、Hugging Face では Arrow 形式が活用されています。

そのため、操作のやり方が普段と少し異なる場合があります。ですが、すでに便利なメソッドが用意されています!

この演習では、wikipedia にデータセットが読み込まれています。

说明 1 / 共 2 个

undefined XP
    1
    2
  • text 列に用語 "football" を含む行でデータセットをフィルタし、filtered に保存します。
  • フィルタ後のデータセットから1件の例を選択し、example に保存します。