1. Learn
  2. /
  3. Courses
  4. /
  5. R로 하는 Supervised Learning: 회귀

Connected

Exercise

실업 모델로 예측하기

이번 연습 문제에서는 실업 모델 unemployment_model을 사용해 unemployment 데이터에서 예측을 수행하고, 예측한 여성 실업률을 학습 데이터인 unemployment에서 관측된 실제 여성 실업률과 비교해 보겠습니다. 또한 newrates의 새 데이터(관측치 1개, 남성 실업률 5%)에 대해서도 예측을 해봅니다.

lm 모델의 predict()(docs) 인터페이스는 다음과 같습니다.

predict(model, newdata)

그래프를 그리기 위해 ggplot2 패키지를 사용할 것이므로, 예측값 열을 unemployment 데이터 프레임에 추가하세요. 결과 변수와 예측값을 산점도로 그리고, 완벽한 예측(즉, 결과값이 예측값과 동일할 때)을 나타내는 선과 비교해 봅니다.

dframe$outcome 대비 dframe$pred의 산점도(pred는 x축, outcome은 y축)와, outcome == pred를 나타내는 파란색 직선을 함께 그리는 ggplot2 명령은 다음과 같습니다.

ggplot(dframe, aes(x = pred, y = outcome)) + 
       geom_point() +  
       geom_abline(color = "blue")

unemployment, unemployment_model, 그리고 newrates는 미리 로드되어 있습니다.

Instructions

100 XP
  • predict()를 사용해 unemployment 데이터에서 여성 실업률을 예측하세요. 새 열 prediction에 할당합니다.
  • library()로 ggplot2 패키지를 불러오세요.
  • ggplot()으로 예측값과 실제 실업률을 비교하세요. 예측값은 x축에 두세요. 결과가 완벽한 예측선에 얼마나 가깝나요?
  • 데이터 프레임 newrates를 사용해 남성 실업률이 5%일 때 예상 여성 실업률을 예측하세요. 답을 변수 pred에 할당하고 출력하세요.