Veri kümelerini düzenleme
Bir veri kümesini bir ML görevi içinde kullanmadan önce çoğu zaman üzerinde düzenleme yapman gerekecek. Yaygın iki düzenleme türü filtreleme ve seçme (veya dilimleme)dir. Bu veri kümelerinin boyutu göz önüne alındığında, Hugging Face arrow dosya türlerinden yararlanır.
Bu da düzenlemelerin, alışık olduğundan biraz farklı şekilde yapılacağı anlamına gelir. Neyse ki bunu kolaylaştıran hazır yöntemler var!
Veri kümesi senin için zaten wikipedia altında yüklendi.
Bu egzersiz, kursun bir parçasıdır
Hugging Face ile Çalışmak
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Filter the documents
____ = wikipedia.____(lambda row: "football" in row["____"])
# Create a sample dataset
example = ____.____(range(1))
print(example[0]["text"])