EDA data melek huruf/angka kelahiran

Dalam beberapa latihan berikut, kita akan melihat korelasi antara melek huruf perempuan dan angka kelahiran (didefinisikan sebagai rata-rata jumlah anak yang lahir per perempuan) di seluruh dunia. Untuk memudahkan analisis dan interpretasi, kita akan menggunakan laju ketaksaan melek huruf.

Selalu merupakan ide yang baik untuk melakukan EDA sebelum analisis. Untuk itu, buat plot angka kelahiran terhadap ketaksaan melek huruf dan hitung koefisien korelasi Pearson. Array NumPy illiteracy memuat laju ketaksaan melek huruf di kalangan perempuan untuk sebagian besar negara di dunia. Array fertility memuat data angka kelahiran yang bersesuaian.

Di sini, akan berguna untuk merujuk kembali ke fungsi yang Anda tulis di kursus sebelumnya untuk menghitung koefisien korelasi Pearson.

Latihan ini merupakan bagian dari kursus

Pemikiran Statistik dengan Python (Bagian 2)

Instruksi latihan

Plot fertility (sumbu-y) terhadap illiteracy (sumbu-x) sebagai scatter plot.
Atur margin sebesar 2%.
Hitung dan cetak koefisien korelasi Pearson antara illiteracy dan fertility.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Plot the illiteracy rate versus fertility
_ = plt.plot(____, ____, ____='.', ____='none')

# Set the margins and label axes
plt.margins(____)
_ = plt.xlabel('percent illiterate')
_ = plt.ylabel('fertility')

# Show the plot
plt.show()

# Show the Pearson correlation coefficient
print(pearson_r(____, ____))

Edit dan Jalankan Kode

Latihan ini merupakan bagian dari kursus

Pemikiran Statistik dengan Python (Bagian 2)

SkillTag.level.intermediateSkillTag.label

4.8+

Mulai Kursus Gratis

Saat melakukan inferensi statistik, kita berbicara dengan bahasa probabilitas. Suatu distribusi probabilitas yang menggambarkan data Anda memiliki parameter. Maka, tujuan utama inferensi statistik adalah memperkirakan nilai parameter-parameter ini, yang memungkinkan kita mendeskripsikan data secara ringkas dan jelas serta menarik kesimpulan darinya. Pada bab ini, Anda akan mempelajari cara menemukan parameter optimal, yaitu parameter yang paling tepat menggambarkan data Anda.

Exercise 1: Parameter optimal Exercise 2: Seberapa sering terjadi no-hitter?Exercise 3: Apakah data mengikuti cerita kita?Exercise 4: Seoptimal apa parameter ini?Exercise 5: Regresi linear dengan kuadrat terkecil Exercise 6: EDA data melek huruf/angka kelahiran

Latihan Saat Ini

Exercise 7: Regresi linear Exercise 8: Seberapa optimal?Exercise 9: Pentingnya EDA: Kuartet Anscombe Exercise 10: Pentingnya EDA Exercise 11: Regresi linear pada data Anscombe yang sesuai Exercise 12: Regresi linear pada seluruh data Anscombe

Ungkapan "pull yourself up by your bootstraps" adalah idiom klasik yang berarti mencapai tugas sulit secara mandiri tanpa bantuan. Dalam inferensi statistik, Anda ingin mengetahui apa yang akan terjadi jika Anda dapat mengulang pengambilan data tanpa batas kali. Tugas ini mustahil, tetapi dapatkah kita hanya menggunakan data yang benar-benar kita miliki untuk mendekati hasil yang sama seperti tak terhitungnya percobaan? Jawabannya ya! Teknik untuk melakukannya tepat disebut bootstrapping. Bab ini akan memperkenalkan Anda pada alat yang sangat kuat ini.

Exercise 1: Membuat replikasi bootstrap Exercise 2: Memantapkan istilah kunci Exercise 3: Bootstrap secara manual Exercise 4: Memvisualisasikan sampel bootstrap Exercise 5: Interval kepercayaan bootstrap Exercise 6: Menghasilkan banyak replikasi bootstrap Exercise 7: Replikasi bootstrap dari rata-rata dan SEM Exercise 8: Interval kepercayaan untuk data curah hujan Exercise 9: Replikasi bootstrap untuk statistik lain Exercise 10: Interval kepercayaan untuk laju no-hitter Exercise 11: Bootstrap berpasangan Exercise 12: Fungsi untuk melakukan pairs bootstrap Exercise 13: Pairs bootstrap pada data melek huruf/kelahiran Exercise 14: Memplot regresi bootstrap

Kini Anda tahu cara mendefinisikan dan mengestimasi parameter dengan suatu model. Namun pertanyaannya tetap: seberapa masuk akal mengamati data Anda jika sebuah model benar? Pertanyaan ini dijawab oleh pengujian hipotesis. Mereka adalah lapisan pemungkas dalam proses inferensi. Setelah menyelesaikan bab ini, Anda akan mampu menyusun dan menguji hipotesis dengan cermat menggunakan hacker statistics.

Exercise 1: Merumuskan dan mensimulasikan sebuah hipotesis Exercise 2: Membuat sampel permutasi Exercise 3: Memvisualisasikan pengambilan sampel permutasi Exercise 4: Statistik uji dan p-value Exercise 5: Statistik uji Exercise 6: Apa itu p-value?Exercise 7: Membuat replika permutasi Exercise 8: Berhati-hatilah sebelum melompat: EDA sebelum pengujian hipotesis Exercise 9: Uji permutasi pada data katak Exercise 10: Uji hipotesis dengan bootstrap Exercise 11: Uji hipotesis bootstrap satu-sampel Exercise 12: Uji hipotesis bootstrap dua-sampel untuk selisih rata-rata

Seperti yang Anda lihat pada bab sebelumnya, pengujian hipotesis bisa agak rumit. Anda perlu mendefinisikan hipotesis nol, memikirkan cara mensimulasikannya, dan merumuskan dengan jelas apa yang dimaksud dengan "lebih ekstrem" untuk menghitung p-value. Seperti keterampilan apa pun, latihan membuat mahir, dan bab ini memberi Anda latihan yang baik dengan pengujian hipotesis.

Exercise 1: Pengujian A/B Exercise 2: Pemungutan suara untuk Civil Rights Act tahun 1964 Exercise 3: Mana yang setara?Exercise 4: Analogi waktu di situs web Exercise 5: Apa yang seharusnya Anda lakukan terlebih dahulu?Exercise 6: Uji korelasi Exercise 7: Mensimulasikan hipotesis nol terkait korelasi Exercise 8: Uji hipotesis pada korelasi Pearson Exercise 9: Apakah insektisida neonicotinoid memiliki konsekuensi yang tidak diinginkan?Exercise 10: Uji hipotesis bootstrap pada jumlah sperma lebah

Setiap tahun selama lebih dari 40 tahun terakhir, Peter dan Rosemary Grant pergi ke pulau Daphne Major di Kepulauan Galápagos dan mengumpulkan data tentang burung finch Darwin. Dengan keterampilan inferensi statistik Anda, Anda akan menghabiskan bab ini dengan data mereka, dan menyaksikan langsung, melalui data, evolusi yang terjadi. Ini adalah cara yang menggugah semangat untuk menutup kursus!

Exercise 1: Paruh burung Finch dan pentingnya statistika Exercise 2: EDA kedalaman paruh burung finch Darwin Exercise 3: ECDF kedalaman paruh Exercise 4: Estimasi parameter kedalaman paruh Exercise 5: Uji hipotesis: Apakah paruh lebih dalam pada 2012?Exercise 6: Variasi bentuk paruh Exercise 7: EDA panjang dan kedalaman paruh Exercise 8: Regresi linear Exercise 9: Menampilkan hasil regresi linear Exercise 10: Rasio panjang terhadap kedalaman paruh Exercise 11: Seberapa berbeda rasionya?Exercise 12: Perhitungan heritabilitas Exercise 13: EDA tentang heritabilitas Exercise 14: Korelasi data anak dan induk Exercise 15: Korelasi Pearson antara data anak dan induk Exercise 16: Mengukur heritabilitas Exercise 17: Apakah kedalaman paruh diwariskan pada G. scandens?Exercise 18: Pemikiran akhir