MulaiMulai sekarang secara gratis

Fitur dengan varians rendah

Pada latihan sebelumnya Anda menentukan bahwa 0,001 adalah ambang batas yang baik untuk menyaring fitur dengan varians rendah di head_df setelah normalisasi. Sekarang gunakan pemilih fitur VarianceThreshold untuk menghapus fitur-fitur tersebut.

Latihan ini adalah bagian dari kursus

Pengurangan Dimensi dengan Python

Lihat Kursus

Petunjuk latihan

  • Buat selector ambang varians dengan ambang 0,001.
  • Normalisasikan DataFrame head_df dengan membaginya dengan nilai rataratanya lalu latih selector tersebut.
  • Buat mask boolean dari selector menggunakan .get_support().
  • Buat DataFrame tereduksi dengan meneruskan mask ke metode .loc[].

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

from sklearn.feature_selection import VarianceThreshold

# Create a VarianceThreshold feature selector
sel = ____(threshold=____)

# Fit the selector to normalized head_df
sel.fit(____ / ____)

# Create a boolean mask
mask = sel.____

# Apply the mask to create a reduced DataFrame
reduced_df = head_df.loc[____, ____]

print(f"Dimensionality reduced from {head_df.shape[1]} to {reduced_df.shape[1]}.")
Edit dan Jalankan Kode