Mengagregasikan fitur numerik
Salah satu penggunaan yang baik untuk mengambil statistik agregat guna membuat fitur baru adalah saat Anda memiliki banyak fitur dengan nilai yang serupa atau saling terkait. Di sini, Anda memiliki DataFrame waktu lari bernama running_times_5k. Untuk setiap name dalam himpunan data, ambillah rataan dari 5 waktu larinya.
Latihan ini adalah bagian dari kursus
Prapemrosesan untuk Machine Learning di Python
Petunjuk latihan
- Gunakan metode
.loc[]untuk memilih semua baris dan kolom guna mencari.mean()dari setiap kolom. - Cetak
.head()dari DataFrame untuk melihat kolommean.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Use .loc to create a mean column
running_times_5k["mean"] = ____.loc[____, ____].____(axis=____)
# Take a look at the results
print(____)