1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python으로 설계하는 Machine Learning 워크플로

Connected

演習

Feature engineering

새로운 대출 신청자 집단이 대출을 연체할 가능성이 있는지 예측하는 업무를 맡으셨습니다. 과거 데이터셋이 있으며, 이를 이용해 분류기를 학습하려고 합니다. 그런데 많은 피처가 문자열 형식이라 분류기에 문제가 됩니다. 따라서 문자열 열을 LabelEncoder()로 수치형으로 인코딩하기로 합니다. 이 함수는 sklearn의 preprocessing 서브모듈에서 미리 로드되어 있습니다. 데이터셋 credit도 미리 로드되어 있으며, 문자열 데이터 타입을 가진 모든 열 이름 목록은 non_numeric_columns에 저장되어 있습니다.

指示1 / 3

undefined XP
    1
    2
    3
  • .head()를 사용해 데이터의 처음 세 행을 확인하세요.