EDA data melek huruf/angka kelahiran
Dalam beberapa latihan berikut, kita akan melihat korelasi antara melek huruf perempuan dan angka kelahiran (didefinisikan sebagai rata-rata jumlah anak yang lahir per perempuan) di seluruh dunia. Untuk memudahkan analisis dan interpretasi, kita akan menggunakan laju ketaksaan melek huruf.
Selalu merupakan ide yang baik untuk melakukan EDA sebelum analisis. Untuk itu, buat plot angka kelahiran terhadap ketaksaan melek huruf dan hitung koefisien korelasi Pearson. Array NumPy illiteracy memuat laju ketaksaan melek huruf di kalangan perempuan untuk sebagian besar negara di dunia. Array fertility memuat data angka kelahiran yang bersesuaian.
Di sini, akan berguna untuk merujuk kembali ke fungsi yang Anda tulis di kursus sebelumnya untuk menghitung koefisien korelasi Pearson.
Latihan ini merupakan bagian dari kursus
Pemikiran Statistik dengan Python (Bagian 2)
Instruksi latihan
- Plot
fertility(sumbu-y) terhadapilliteracy(sumbu-x) sebagai scatter plot. - Atur margin sebesar 2%.
- Hitung dan cetak koefisien korelasi Pearson antara
illiteracydanfertility.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Plot the illiteracy rate versus fertility
_ = plt.plot(____, ____, ____='.', ____='none')
# Set the margins and label axes
plt.margins(____)
_ = plt.xlabel('percent illiterate')
_ = plt.ylabel('fertility')
# Show the plot
plt.show()
# Show the Pearson correlation coefficient
print(pearson_r(____, ____))