Statistika ringkas untuk kedua kelas
Pertimbangkan kode .groupby() berikut:
# Group by x and compute the standard deviation
df.groupby(['x']).std()
Di sini, DataFrame df dikelompokkan berdasarkan kolom 'x', lalu simpangan baku dihitung untuk semua kolom df pada setiap nilai 'x'. Metode .groupby() sangat berguna saat Anda ingin menelusuri kolom tertentu dalam himpunan data Anda. Kali ini, Anda akan mengeksplorasi kolom 'Churn' lebih lanjut untuk melihat apakah ada perbedaan antara pelanggan yang churn dan yang tidak. Sebuah subset dari DataFrame telco, yang terdiri atas kolom 'Churn', 'CustServ_Calls', dan 'Vmail_Message', tersedia di workspace Anda.
Jika Anda perlu penyegaran tentang cara kerja .groupby(), silakan merujuk kembali ke kursus prasyarat Manipulating DataFrames with pandas.
Latihan ini merupakan bagian dari kursus
Analitik Pemasaran: Memprediksi Churn Pelanggan di Python
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Group telco by 'Churn' and compute the mean
print(telco.____(['____']).____())