EDA data melek huruf/angka kelahiran
Dalam beberapa latihan berikut, kita akan melihat korelasi antara melek huruf perempuan dan angka kelahiran (didefinisikan sebagai rata-rata jumlah anak yang lahir per perempuan) di seluruh dunia. Untuk memudahkan analisis dan interpretasi, kita akan menggunakan laju ketaksaan melek huruf.
Selalu merupakan ide yang baik untuk melakukan EDA sebelum analisis. Untuk itu, buat plot angka kelahiran terhadap ketaksaan melek huruf dan hitung koefisien korelasi Pearson. Array NumPy illiteracy memuat laju ketaksaan melek huruf di kalangan perempuan untuk sebagian besar negara di dunia. Array fertility memuat data angka kelahiran yang bersesuaian.
Di sini, akan berguna untuk merujuk kembali ke fungsi yang Anda tulis di kursus sebelumnya untuk menghitung koefisien korelasi Pearson.
Latihan ini adalah bagian dari kursus
Pemikiran Statistik dengan Python (Bagian 2)
Petunjuk latihan
- Plot
fertility(sumbu-y) terhadapilliteracy(sumbu-x) sebagai scatter plot. - Atur margin sebesar 2%.
- Hitung dan cetak koefisien korelasi Pearson antara
illiteracydanfertility.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Plot the illiteracy rate versus fertility
_ = plt.plot(____, ____, ____='.', ____='none')
# Set the margins and label axes
plt.margins(____)
_ = plt.xlabel('percent illiterate')
_ = plt.ylabel('fertility')
# Show the plot
plt.show()
# Show the Pearson correlation coefficient
print(pearson_r(____, ____))