Memprediksi dari model pengangguran
Pada latihan ini, Anda akan menggunakan model pengangguran Anda, unemployment_model, untuk membuat prediksi dari data unemployment, lalu membandingkan tingkat pengangguran perempuan hasil prediksi dengan tingkat pengangguran perempuan aktual pada data latih, unemployment. Anda juga akan menggunakan model untuk memprediksi pada data baru di newrates, yang hanya berisi satu observasi, yaitu ketika pengangguran laki-laki sebesar 5%.
Antarmuka predict() (docs) untuk model lm berbentuk
predict(model, newdata)
Anda akan menggunakan paket ggplot2 untuk membuat plot, sehingga Anda akan menambahkan kolom prediksi ke data frame unemployment. Anda akan membuat plot antara keluaran dan prediksi, lalu membandingkannya dengan garis yang merepresentasikan prediksi sempurna (yaitu ketika keluaran sama dengan nilai prediksi).
Perintah ggplot2 untuk membuat scatterplot dframe$outcome terhadap dframe$pred (pred pada sumbu x, outcome pada sumbu y), beserta garis berwarna biru tempat outcome == pred adalah sebagai berikut:
ggplot(dframe, aes(x = pred, y = outcome)) +
geom_point() +
geom_abline(color = "blue")
unemployment, unemployment_model, dan newrates telah dimuat sebelumnya untuk Anda.
Latihan ini adalah bagian dari kursus
Supervised Learning di R: Regresi
Petunjuk latihan
- Gunakan
predict()untuk memprediksi tingkat pengangguran perempuan dari dataunemployment. Simpan hasilnya ke kolom baru:prediction. - Gunakan perintah
library()untuk memuat paketggplot2. - Gunakan
ggplot()untuk membandingkan prediksi dengan tingkat pengangguran aktual. Letakkan prediksi pada sumbu x. Seberapa dekat hasilnya dengan garis prediksi sempurna? - Gunakan data frame
newratesuntuk memprediksi tingkat pengangguran perempuan yang diharapkan ketika pengangguran laki-laki sebesar 5%. Simpan jawabannya ke variabelpreddan cetak.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# unemployment is available
summary(unemployment)
# newrates is available
newrates
# Predict female unemployment in the unemployment dataset
unemployment$prediction <- ___
# Load the ggplot2 package
___
# Make a plot to compare predictions to actual (prediction on x axis).
ggplot(___, aes(x = ___, y = ___)) +
___ +
geom_abline(color = "blue")
# Predict female unemployment rate when male unemployment is 5%
pred <- ___
pred