Memvisualisasikan hubungan variabel
Dalam latihan sebelumnya, Anda mungkin melihat bahwa marriage_duration yang lebih lama berkorelasi dengan jumlah anak yang lebih banyak, yang direpresentasikan oleh kolom num_kids. Koefisien korelasi antara variabel marriage_duration dan num_kids adalah 0,45.
Dalam latihan ini, Anda akan membuat scatter plot untuk memvisualisasikan hubungan antara kedua variabel tersebut. pandas telah dimuat sebagai pd, matplotlib.pyplot telah dimuat sebagai plt, dan Seaborn telah dimuat sebagai sns. Nama himpunan datanya adalah divorce.
Latihan ini adalah bagian dari kursus
Analisis Data Eksploratif di Python
Petunjuk latihan
- Buat sebuah scatterplot yang menampilkan
marriage_durationpada sumbu-x dannum_kidspada sumbu-y.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create the scatterplot
____
plt.show()