1. 학습
  2. /
  3. 강의
  4. /
  5. Python 중급 예측 분석

Connected

연습 문제

타임라인 위반

타임라인의 중요성을 보여 주기 위해, 타깃 기간의 정보를 사용해 예측 변수를 구성하는, 즉 타임라인을 위반하는 예시를 살펴보겠습니다.

pandas 데이터프레임 basetable에는 두 개의 열이 있습니다. "amount_2017"는 2017년 기부금 총액이고, "target"은 이 금액이 30을 초과하면 1, 그렇지 않으면 0입니다.

"amount_2017"를 단일 예측 변수로 사용하여 타깃을 예측하는 로지스틱 회귀 모델을 만들고, AUC를 계산하세요.

지침

100 XP
  • 예측 변수를 담은 데이터프레임 X와 타깃을 담은 데이터프레임 y를 생성하세요.
  • X로부터 y를 예측하도록 로지스틱 회귀 모델을 학습하세요. amount_2017를 단일 예측 변수로 사용하여 target을 예측하는 로지스틱 회귀 모델을 구성하세요.
  • X의 객체들에 대한 예측을 수행하세요.
  • roc_auc_score 함수를 사용해 이 모델의 AUC를 계산하고 출력하세요.