Tulis kode regresi sederhana satu variabel
Untuk latihan pemrograman pertama, Anda akan membuat sebuah formula untuk mendefinisikan tugas pemodelan satu variabel, lalu menyesuaikan model linear pada data. Anda diberikan laju pengangguran laki-laki dan perempuan di Amerika Serikat selama beberapa tahun (Sumber).
Tugasnya adalah memprediksi laju pengangguran perempuan dari laju pengangguran laki-laki yang diamati.
Outcome adalah female_unemployment, dan input adalah male_unemployment.
Tanda koefisien variabel memberi tahu Anda apakah outcome meningkat (+) atau menurun (-) ketika variabel meningkat.
Ingat antarmuka pemanggilan untuk lm() (docs) adalah:
lm(formula, data = ___)
Data frame unemployment telah dimuat sebelumnya.
Latihan ini adalah bagian dari kursus
Supervised Learning di R: Regresi
Petunjuk latihan
- Definisikan sebuah formula yang menyatakan
female_unemploymentsebagai fungsi darimale_unemployment. Tetapkan formula tersebut ke variabelfmladan cetak. - Lalu gunakan
lm()danfmlauntuk menyesuaikan model linear guna memprediksi pengangguran perempuan dari pengangguran laki-laki menggunakan himpunan dataunemployment. - Cetak modelnya. Apakah koefisien untuk pengangguran laki-laki sesuai dengan yang Anda harapkan? Apakah pengangguran perempuan meningkat seiring meningkatnya pengangguran laki-laki?
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# unemployment is available
summary(unemployment)
# Define a formula to express female_unemployment as a function of male_unemployment
fmla <- ___
# Print it
___
# Use the formula to fit a model: unemployment_model
unemployment_model <- ___
# Print it
___