İlgili özellikleri seçme
Bu egzersizde, volunteer veri kümesindeki gereksiz sütunları belirleyecek ve veri kümesi üzerinde özellik seçimi yaparak ilgili özelliklerden oluşan bir DataFrame döndüreceksin.
Örneğin, konsolda volunteer veri kümesini incelersen konumla ilgili üç özellik görürsün: locality, region ve postalcode. Bunlar ilişkili bilgiler içerir, bu nedenle yalnızca bu özelliklerden birini tutmak mantıklı olur.
Biraz zaman ayırıp konsolda volunteer özelliklerini incele ve gereksiz (redundant) özellikleri belirlemeye çalış.
Bu egzersiz
Python'da Machine Learning için Ön İşleme
kursunun bir parçasıdırEgzersiz talimatları
- Gereksiz sütun adlarından bir liste oluştur ve
to_dropdeğişkeninde sakla:- Konumla ilgili tüm özellikler arasından yalnızca
postalcodekalsın. - Özellik mühendisliğinden geçmiş özellikler de gereksizdir.
- Konumla ilgili tüm özellikler arasından yalnızca
- Veri kümesinden
to_droplistesindeki sütunları düş. - Seçilen sütunları görmek için
volunteer_subset'in.head()çıktısını yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create a list of redundant column names to drop
to_drop = ["____", "____", "____", "____", "____"]
# Drop those columns from the dataset
volunteer_subset = ____.____(____, ____)
# Print out the head of volunteer_subset
print(____)