1. Learn
  2. /
  3. Courses
  4. /
  5. Python으로 연습하는 Machine Learning 면접 질문

Connected

Exercise

PCA로 클래스 분리 시각화 I

Machine Learning 면접에서 자주 나오는 질문 중 하나는 PCA 이후 차원을 어떻게 시각화하느냐입니다. 이 연습에서는 loan_data의 처음 두 개 주성분을 그려서, 대출 상태가 완납되었는지(fully paid) 혹은 상각되었는지(charged off)에 따라 두 구성요소에서 클래스가 어떻게 분리되는지 시각화해 보겠습니다.

loan_data 데이터셋은 이미 스케일링과 원-핫 인코딩이 되어 있습니다. 즉, 범주형 변수가 이진 지표로 변환되었으며, PCA 전에 모든 특성이 같은 스케일의 수치형이 되도록 준비되어 있습니다.

2개의 PC를 사용하는 PCA 모델과 x, y 레이블 및 제목이 설정된 플롯은 이미 준비되어 있습니다. 연습에서는 loan_data_PCA라는 DataFrame을 사용합니다. 타깃 변수 Loan Status의 가능한 값은 0과 1입니다. x축에는 PC1, y축에는 PC2를 그립니다.

이미 matplotlib.pyplot은 plt로, seaborn은 sns로, sklearn.decomposition의 PCA는 임포트되어 있습니다.

Instructions 1/3

undefined XP
    1
    2
    3
  • 타깃 변수 값을 리스트 targets에 할당하세요.
  • 방금 만든 리스트들을 for 루프 안의 zip() 함수에 전달하세요.
  • Loan Status가 target과 같은 행의 인덱스를 indicesToKeep에 저장하세요.