Statistika ringkas untuk kedua kelas
Pertimbangkan kode .groupby() berikut:
# Group by x and compute the standard deviation
df.groupby(['x']).std()
Di sini, DataFrame df dikelompokkan berdasarkan kolom 'x', lalu simpangan baku dihitung untuk semua kolom df pada setiap nilai 'x'. Metode .groupby() sangat berguna saat Anda ingin menelusuri kolom tertentu dalam himpunan data Anda. Kali ini, Anda akan mengeksplorasi kolom 'Churn' lebih lanjut untuk melihat apakah ada perbedaan antara pelanggan yang churn dan yang tidak. Sebuah subset dari DataFrame telco, yang terdiri atas kolom 'Churn', 'CustServ_Calls', dan 'Vmail_Message', tersedia di workspace Anda.
Jika Anda perlu penyegaran tentang cara kerja .groupby(), silakan merujuk kembali ke kursus prasyarat Manipulating DataFrames with pandas.
Latihan ini adalah bagian dari kursus
Analitik Pemasaran: Memprediksi Churn Pelanggan di Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Group telco by 'Churn' and compute the mean
print(telco.____(['____']).____())