Veri kümelerini düzenleme
Bir veri kümesini bir ML görevi içinde kullanmadan önce çoğu zaman üzerinde düzenleme yapman gerekecek. Yaygın iki düzenleme türü filtreleme ve seçme (veya dilimleme)dir. Bu veri kümelerinin boyutu göz önüne alındığında, Hugging Face arrow dosya türlerinden yararlanır.
Bu da düzenlemelerin, alışık olduğundan biraz farklı şekilde yapılacağı anlamına gelir. Neyse ki bunu kolaylaştıran hazır yöntemler var!
Veri kümesi senin için zaten wikipedia altında yüklendi.
Bu egzersiz
Hugging Face ile Çalışmak
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Filter the documents
____ = wikipedia.____(lambda row: "football" in row["____"])
# Create a sample dataset
example = ____.____(range(1))
print(example[0]["text"])