1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 연습하는 Machine Learning 면접 질문

Connected

연습 문제

로지스틱 회귀 기준 분류기

직전 2개 레슨에서 Machine Learning 인터뷰 맥락에서 특징 선택이 얼마나 중요한지 살펴봤어요. 인터뷰에서 자주 나오는 또 다른 주제는 특징 공학이며, 이것이 모델 성능 향상에 어떻게 도움이 되는지에 관한 질문입니다.

이 연습 문제에서는 1장에서 사용한 loan_data 데이터셋에 새 특징을 만들고, 특징 공학 전후의 데이터셋에 대해 로지스틱 회귀 모델의 정확도를 비교해 봅니다. 테스트 레이블과 타깃 변수 Loan Status의 예측값을 비교해 정확도를 계산하세요.

필요한 패키지는 모두 임포트되어 있습니다: matplotlib.pyplot은 plt, seaborn은 sns, sklearn.linear_model의 LogisticRegression, sklearn.model_selection의 train_test_split, sklearn.metrics의 accuracy_score.

특징 공학은 모델링 전에 수행하는 전처리 단계로 간주됩니다: Machine learning pipeline

지침 1/4

undefined XP
  • 1
    • 타깃 변수 Loan Status를 y로 하여 loan_data에 로지스틱 회귀를 학습하고 예측한 뒤, 학습된 모델의 정확도를 평가하세요.
  • 2
    • Annual Income을 월 단위로 변환하고, Monthly Debt를 monthly_income으로 나눈 비율을 계산해 dti_ratio에 저장하세요.
  • 3
    • 타깃 변수를 숫자형으로 변환하고, 범주형 특징은 더미 변수로 대체하세요.
  • 4
    • loans_dti에 로지스틱 회귀를 학습하고 예측한 뒤, 학습된 모델의 정확도를 평가하세요.