Mengagregasikan fitur numerik
Salah satu penggunaan yang baik untuk mengambil statistik agregat guna membuat fitur baru adalah saat Anda memiliki banyak fitur dengan nilai yang serupa atau saling terkait. Di sini, Anda memiliki DataFrame waktu lari bernama running_times_5k. Untuk setiap name dalam himpunan data, ambillah rataan dari 5 waktu larinya.
Latihan ini merupakan bagian dari kursus
Prapemrosesan untuk Machine Learning di Python
Instruksi latihan
- Gunakan metode
.loc[]untuk memilih semua baris dan kolom guna mencari.mean()dari setiap kolom. - Cetak
.head()dari DataFrame untuk melihat kolommean.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Use .loc to create a mean column
running_times_5k["mean"] = ____.loc[____, ____].____(axis=____)
# Take a look at the results
print(____)