Memahami perbedaan pada variabel
Sekarang, Anda akan menganalisis rerata dan simpangan baku dari setiap variabel dengan memvisualisasikannya dalam barplot. Ini adalah langkah pelengkap dari sebelumnya, karena Anda akan menelusuri secara visual perbedaan skala dan varians antarvariabel.
Pustaka pandas telah dimuat sebagai pd dan matplotlib.pyplot sebagai plt. Selain itu, himpunan data wholesale telah dimuat sebagai DataFrame pandas, sedangkan rerata dan simpangan baku untuk setiap kolom pada himpunan data wholesale telah dimuat sebagai Series pandas bernama averages dan std_devs. Pastikan Anda menelusuri keduanya di konsol.
Latihan ini adalah bagian dari kursus
Machine Learning untuk Pemasaran dengan Python
Petunjuk latihan
- Buat sebuah daftar berisi nama kolom
wholesaledan satu lagi berisi nilai yang diurutkan dari 0 hingga jumlah kolom diwholesale. - Plot
averagesdengan warna abu-abu danstd_devsdengan warna oranye, sesuaikan sumbu-x sebesar 0,2 - Tambahkan
x_ixsebagai ticks danx_namessebagai label serta pastikan Anda memutarnya 90 derajat. - Tambahkan legend dan tampilkan bagan.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create column names list and same length integer list
x_names = wholesale.___
x_ix = np.arange(wholesale.shape[1])
# Plot the averages data in gray and standard deviations in orange
plt.bar(x=x_ix-___, height=averages, color='grey', label='Average', width=0.4)
plt.bar(x=x_ix+___, height=std_devs, color='orange', label='Standard Deviation', width=0.4)
# Add x-axis labels and rotate
plt.xticks(ticks=___, labels=x_names, rotation=90)
# Add the legend and display the chart
plt.legend()
plt.___()