Fitur dengan varians rendah
Pada latihan sebelumnya Anda menentukan bahwa 0,001 adalah ambang batas yang baik untuk menyaring fitur dengan varians rendah di head_df setelah normalisasi. Sekarang gunakan pemilih fitur VarianceThreshold untuk menghapus fitur-fitur tersebut.
Latihan ini adalah bagian dari kursus
Pengurangan Dimensi dengan Python
Petunjuk latihan
- Buat selector ambang varians dengan ambang 0,001.
- Normalisasikan DataFrame
head_dfdengan membaginya dengan nilai rataratanya lalu latih selector tersebut. - Buat mask boolean dari selector menggunakan
.get_support(). - Buat DataFrame tereduksi dengan meneruskan mask ke metode
.loc[].
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
from sklearn.feature_selection import VarianceThreshold
# Create a VarianceThreshold feature selector
sel = ____(threshold=____)
# Fit the selector to normalized head_df
sel.fit(____ / ____)
# Create a boolean mask
mask = sel.____
# Apply the mask to create a reduced DataFrame
reduced_df = head_df.loc[____, ____]
print(f"Dimensionality reduced from {head_df.shape[1]} to {reduced_df.shape[1]}.")