Tinjauan awal
Dengan menggunakan himpunan data Avazu lengkap, Anda akan mengeksplorasi berbagai fitur baru dengan melihat tipe data pada kolom-kolomnya. Data baru ini mencakup kolom kategorikal seperti site_id, app_id, device_id, dan lain-lain, yang masing-masing merupakan pengenal untuk suatu situs, aplikasi, dan pengguna. Untuk memulai, Anda akan mengidentifikasi dan mencetak kolom numerik dan kategorikal.
Data contoh dalam bentuk DataFrame telah dimuat sebagai df. pandas sebagai pd juga tersedia di ruang kerja Anda.
Latihan ini adalah bagian dari kursus
Memprediksi CTR dengan Machine Learning di Python
Petunjuk latihan
- Cetak kolom
dfmenggunakan.columns. - Cetak tipe data yang sesuai dari
dfmenggunakan.dtypes. - Pilih subset
dfdengan kolom numerik (dengan menggunakaninclude = ['int', 'float']) dan cetak kolom-kolom tersebut. - Pilih subset
dfdengan kolom kategorikal (dengan menggunakaninclude = ['object']) dan cetak kolom-kolom tersebut.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Print columns
print(df.____)
# Print data types of columns
print(df.____)
# Select and print numeric columns
numeric_df = df.____(include=['____', 'float'])
print(numeric_df.____)
# Select and print categorical columns
categorical_df = df.____(include=['____'])
print(categorical_df.____)