1. Lära sig
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 Machine Learning 특성 공학

Connected

exercise

Train and testing transformations (II)

학습 세트와 테스트 세트에 같은 스케일러를 적용하는 것과 마찬가지로, 학습 세트에서 이상치를 제거했다면 테스트 세트에도 동일하게 적용해야 해요. 이때도 마찬가지로 테스트 세트의 이상치를 제거할 때는 반드시 학습 세트에서만 계산한 임계값 을 사용해야 합니다.

이전 연습 문제와 유사하게, so_numeric_df DataFrame을 학습(so_train_numeric)과 테스트(so_test_numeric) 세트로 분할해 두었습니다.

Instruktioner

100 XP
  • ConvertedSalary 열의 표준편차와 평균을 계산하세요.
  • 평균에서 양방향으로 표준편차 세 배만큼 떨어진 값을 하한과 상한으로 계산하세요.
  • ConvertedSalary가 하한과 상한 사이에 있는 행만 유지하도록 so_test_numeric DataFrame을 잘라내세요.