MulaiMulai sekarang secara gratis

Memprediksi dari model pengangguran

Pada latihan ini, Anda akan menggunakan model pengangguran Anda, unemployment_model, untuk membuat prediksi dari data unemployment, lalu membandingkan tingkat pengangguran perempuan hasil prediksi dengan tingkat pengangguran perempuan aktual pada data latih, unemployment. Anda juga akan menggunakan model untuk memprediksi pada data baru di newrates, yang hanya berisi satu observasi, yaitu ketika pengangguran laki-laki sebesar 5%.

Antarmuka predict() (docs) untuk model lm berbentuk

predict(model, newdata)

Anda akan menggunakan paket ggplot2 untuk membuat plot, sehingga Anda akan menambahkan kolom prediksi ke data frame unemployment. Anda akan membuat plot antara keluaran dan prediksi, lalu membandingkannya dengan garis yang merepresentasikan prediksi sempurna (yaitu ketika keluaran sama dengan nilai prediksi).

Perintah ggplot2 untuk membuat scatterplot dframe$outcome terhadap dframe$pred (pred pada sumbu x, outcome pada sumbu y), beserta garis berwarna biru tempat outcome == pred adalah sebagai berikut:

ggplot(dframe, aes(x = pred, y = outcome)) + 
       geom_point() +  
       geom_abline(color = "blue")

unemployment, unemployment_model, dan newrates telah dimuat sebelumnya untuk Anda.

Latihan ini adalah bagian dari kursus

Supervised Learning di R: Regresi

Lihat Kursus

Petunjuk latihan

  • Gunakan predict() untuk memprediksi tingkat pengangguran perempuan dari data unemployment. Simpan hasilnya ke kolom baru: prediction.
  • Gunakan perintah library() untuk memuat paket ggplot2.
  • Gunakan ggplot() untuk membandingkan prediksi dengan tingkat pengangguran aktual. Letakkan prediksi pada sumbu x. Seberapa dekat hasilnya dengan garis prediksi sempurna?
  • Gunakan data frame newrates untuk memprediksi tingkat pengangguran perempuan yang diharapkan ketika pengangguran laki-laki sebesar 5%. Simpan jawabannya ke variabel pred dan cetak.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# unemployment is available
summary(unemployment)

# newrates is available
newrates

# Predict female unemployment in the unemployment dataset
unemployment$prediction <-  ___

# Load the ggplot2 package
___

# Make a plot to compare predictions to actual (prediction on x axis). 
ggplot(___, aes(x = ___, y = ___)) + 
  ___ +
  geom_abline(color = "blue")

# Predict female unemployment rate when male unemployment is 5%
pred <- ___
pred
Edit dan Jalankan Kode