MulaiMulai sekarang secara gratis

Normalisasi log

Standardisasi penting agar semua fitur dapat dibandingkan. Normalisasi log adalah metode standardisasi yang umum. Anda akan memeriksa varians dari beberapa fitur terpilih dan menghitung median varians keseluruhan di antara fitur. Fitur yang digunakan adalah fitur numerik, kecuali kolom click, banner_pos, device_type, serta kolom search_engine_type, product_type, advertiser_type dari pelajaran sebelumnya karena sebenarnya merupakan kolom kategorikal. Lalu Anda akan menerapkan normalisasi log pada kolom-kolom yang memiliki varians lebih tinggi daripada median varians dan memeriksa hasilnya.

Modul pandas tersedia sebagai pd di workspace Anda dan DataFrame contoh telah dimuat sebagai df.

Latihan ini adalah bagian dari kursus

Memprediksi CTR dengan Machine Learning di Python

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Select numeric columns and print variance
num_df = df.____(include=['int', 'float'])
filter_cols = ['click', 'banner_pos', 'device_type',
               'search_engine_type', 'product_type', 'advertiser_type']
new_df = num_df[num_df.columns[~num_df.columns.____(filter_cols)]]
median = new_df.____.____
print(median)
Edit dan Jalankan Kode