Regresi linear

Kita akan mengasumsikan bahwa fertilitas merupakan fungsi linear dari tingkat buta huruf perempuan. Yaitu, \(f = a i + b\), di mana \(a\) adalah kemiringan (slope) dan \(b\) adalah intersep. Kita dapat memandang intersep sebagai laju fertilitas minimal, kemungkinan berada antara satu dan dua. Nilai kemiringan menunjukkan bagaimana laju fertilitas bervariasi terhadap tingkat buta huruf. Kita dapat menemukan garis terbaik menggunakan np.polyfit().

Buat plot data dan garis terbaiknya. Cetak kemiringan dan intersepnya. (Pikirkan: apa satuannya?)

Latihan ini merupakan bagian dari kursus

Pemikiran Statistik dengan Python (Bagian 2)

Instruksi latihan

Hitung kemiringan dan intersep garis regresi menggunakan np.polyfit(). Ingat, fertility berada pada sumbu-y dan illiteracy pada sumbu-x.
Cetak kemiringan dan intersep dari regresi linear.
Untuk memplot garis terbaik, buat array x yang berisi 0 dan 100 menggunakan np.array(). Lalu, hitung nilai teoretis y berdasarkan parameter regresi Anda, yaitu y = a * x + b.
Plot data dan garis regresi pada plot yang sama. Pastikan memberi label pada sumbu.
Tekan submit untuk menampilkan plot Anda.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Plot the illiteracy rate versus fertility
_ = plt.plot(illiteracy, fertility, marker='.', linestyle='none')
plt.margins(0.02)
_ = plt.xlabel('percent illiterate')
_ = plt.ylabel('fertility')

# Perform a linear regression using np.polyfit(): a, b
a, b = ____

# Print the results to the screen
print('slope =', a, 'children per woman / percent illiterate')
print('intercept =', b, 'children per woman')

# Make theoretical line to plot
x = ____
y = ____ * ____ + ____

# Add regression line to your plot
_ = plt.plot(____, ____)

# Draw the plot
plt.show()

Edit dan Jalankan Kode

Latihan ini merupakan bagian dari kursus

Pemikiran Statistik dengan Python (Bagian 2)

SkillTag.level.intermediateSkillTag.label

4.8+

Mulai Kursus Gratis

Saat melakukan inferensi statistik, kita berbicara dengan bahasa probabilitas. Suatu distribusi probabilitas yang menggambarkan data Anda memiliki parameter. Maka, tujuan utama inferensi statistik adalah memperkirakan nilai parameter-parameter ini, yang memungkinkan kita mendeskripsikan data secara ringkas dan jelas serta menarik kesimpulan darinya. Pada bab ini, Anda akan mempelajari cara menemukan parameter optimal, yaitu parameter yang paling tepat menggambarkan data Anda.

Exercise 1: Parameter optimal Exercise 2: Seberapa sering terjadi no-hitter?Exercise 3: Apakah data mengikuti cerita kita?Exercise 4: Seoptimal apa parameter ini?Exercise 5: Regresi linear dengan kuadrat terkecil Exercise 6: EDA data melek huruf/angka kelahiran Exercise 7: Regresi linear

Latihan Saat Ini

Exercise 8: Seberapa optimal?Exercise 9: Pentingnya EDA: Kuartet Anscombe Exercise 10: Pentingnya EDA Exercise 11: Regresi linear pada data Anscombe yang sesuai Exercise 12: Regresi linear pada seluruh data Anscombe

Ungkapan "pull yourself up by your bootstraps" adalah idiom klasik yang berarti mencapai tugas sulit secara mandiri tanpa bantuan. Dalam inferensi statistik, Anda ingin mengetahui apa yang akan terjadi jika Anda dapat mengulang pengambilan data tanpa batas kali. Tugas ini mustahil, tetapi dapatkah kita hanya menggunakan data yang benar-benar kita miliki untuk mendekati hasil yang sama seperti tak terhitungnya percobaan? Jawabannya ya! Teknik untuk melakukannya tepat disebut bootstrapping. Bab ini akan memperkenalkan Anda pada alat yang sangat kuat ini.

Exercise 1: Membuat replikasi bootstrap Exercise 2: Memantapkan istilah kunci Exercise 3: Bootstrap secara manual Exercise 4: Memvisualisasikan sampel bootstrap Exercise 5: Interval kepercayaan bootstrap Exercise 6: Menghasilkan banyak replikasi bootstrap Exercise 7: Replikasi bootstrap dari rata-rata dan SEM Exercise 8: Interval kepercayaan untuk data curah hujan Exercise 9: Replikasi bootstrap untuk statistik lain Exercise 10: Interval kepercayaan untuk laju no-hitter Exercise 11: Bootstrap berpasangan Exercise 12: Fungsi untuk melakukan pairs bootstrap Exercise 13: Pairs bootstrap pada data melek huruf/kelahiran Exercise 14: Memplot regresi bootstrap

Kini Anda tahu cara mendefinisikan dan mengestimasi parameter dengan suatu model. Namun pertanyaannya tetap: seberapa masuk akal mengamati data Anda jika sebuah model benar? Pertanyaan ini dijawab oleh pengujian hipotesis. Mereka adalah lapisan pemungkas dalam proses inferensi. Setelah menyelesaikan bab ini, Anda akan mampu menyusun dan menguji hipotesis dengan cermat menggunakan hacker statistics.

Exercise 1: Merumuskan dan mensimulasikan sebuah hipotesis Exercise 2: Membuat sampel permutasi Exercise 3: Memvisualisasikan pengambilan sampel permutasi Exercise 4: Statistik uji dan p-value Exercise 5: Statistik uji Exercise 6: Apa itu p-value?Exercise 7: Membuat replika permutasi Exercise 8: Berhati-hatilah sebelum melompat: EDA sebelum pengujian hipotesis Exercise 9: Uji permutasi pada data katak Exercise 10: Uji hipotesis dengan bootstrap Exercise 11: Uji hipotesis bootstrap satu-sampel Exercise 12: Uji hipotesis bootstrap dua-sampel untuk selisih rata-rata

Seperti yang Anda lihat pada bab sebelumnya, pengujian hipotesis bisa agak rumit. Anda perlu mendefinisikan hipotesis nol, memikirkan cara mensimulasikannya, dan merumuskan dengan jelas apa yang dimaksud dengan "lebih ekstrem" untuk menghitung p-value. Seperti keterampilan apa pun, latihan membuat mahir, dan bab ini memberi Anda latihan yang baik dengan pengujian hipotesis.

Exercise 1: Pengujian A/B Exercise 2: Pemungutan suara untuk Civil Rights Act tahun 1964 Exercise 3: Mana yang setara?Exercise 4: Analogi waktu di situs web Exercise 5: Apa yang seharusnya Anda lakukan terlebih dahulu?Exercise 6: Uji korelasi Exercise 7: Mensimulasikan hipotesis nol terkait korelasi Exercise 8: Uji hipotesis pada korelasi Pearson Exercise 9: Apakah insektisida neonicotinoid memiliki konsekuensi yang tidak diinginkan?Exercise 10: Uji hipotesis bootstrap pada jumlah sperma lebah

Setiap tahun selama lebih dari 40 tahun terakhir, Peter dan Rosemary Grant pergi ke pulau Daphne Major di Kepulauan Galápagos dan mengumpulkan data tentang burung finch Darwin. Dengan keterampilan inferensi statistik Anda, Anda akan menghabiskan bab ini dengan data mereka, dan menyaksikan langsung, melalui data, evolusi yang terjadi. Ini adalah cara yang menggugah semangat untuk menutup kursus!

Exercise 1: Paruh burung Finch dan pentingnya statistika Exercise 2: EDA kedalaman paruh burung finch Darwin Exercise 3: ECDF kedalaman paruh Exercise 4: Estimasi parameter kedalaman paruh Exercise 5: Uji hipotesis: Apakah paruh lebih dalam pada 2012?Exercise 6: Variasi bentuk paruh Exercise 7: EDA panjang dan kedalaman paruh Exercise 8: Regresi linear Exercise 9: Menampilkan hasil regresi linear Exercise 10: Rasio panjang terhadap kedalaman paruh Exercise 11: Seberapa berbeda rasionya?Exercise 12: Perhitungan heritabilitas Exercise 13: EDA tentang heritabilitas Exercise 14: Korelasi data anak dan induk Exercise 15: Korelasi Pearson antara data anak dan induk Exercise 16: Mengukur heritabilitas Exercise 17: Apakah kedalaman paruh diwariskan pada G. scandens?Exercise 18: Pemikiran akhir