1. 학습
  2. /
  3. 강의
  4. /
  5. Python 중급 예측 분석

Connected

연습 문제

진화 변수의 성능

basetable에는 3개의 일반 예측 변수 "gender_F", "age", "donations_2017"와, 2017년 기부 횟수에서 2016년 기부 횟수를 뺀 값을 담은 진화 변수 "donations_2017_min_2016"가 들어 있습니다.

이번 연습에서는 진화 변수를 사용했을 때의 추가적인 가치를 확인합니다. 두 개의 예측 모델을 만들 텐데요, 하나는 variables_regular에 제공된 일반 예측 변수를 사용하고, 다른 하나는 "donations_2017"을 "donations_2017_min_2016"으로 대체한 변수를 사용합니다. 이 변수들은 variables_evolution에 제공되어 있어요. 로지스틱 회귀 모델은 logreg에 이미 초기화되어 있습니다. 일반 변수를 사용한 모델은 이미 구현되어 있으며, 그 AUC는 auc_regular에 저장되어 있어요.

지침

100 XP
  • 진화 변수로 X_evolution을 구성하고 모델을 학습하세요.
  • 이 모델로 X_evolution의 모든 관측치에 대해 .predict_proba()로 예측한 뒤 roc_auc_score()로 AUC를 계산하세요.
  • 두 모델의 AUC를 출력하고 비교하세요.