로지스틱 회귀 기준 분류기

직전 2개 레슨에서 Machine Learning 인터뷰 맥락에서 특징 선택이 얼마나 중요한지 살펴봤어요. 인터뷰에서 자주 나오는 또 다른 주제는 특징 공학이며, 이것이 모델 성능 향상에 어떻게 도움이 되는지에 관한 질문입니다.

이 연습 문제에서는 1장에서 사용한 loan_data 데이터셋에 새 특징을 만들고, 특징 공학 전후의 데이터셋에 대해 로지스틱 회귀 모델의 정확도를 비교해 봅니다. 테스트 레이블과 타깃 변수 Loan Status의 예측값을 비교해 정확도를 계산하세요.

필요한 패키지는 모두 임포트되어 있습니다: matplotlib.pyplot은 plt, seaborn은 sns, sklearn.linear_model의 LogisticRegression, sklearn.model_selection의 train_test_split, sklearn.metrics의 accuracy_score.