1. Learn
  2. /
  3. Courses
  4. /
  5. PySpark로 하는 Feature Engineering

Connected

Exercise

스케일러를 스케일링하기

이전 연습 문제에서는 단일 변수를 MinMax 스케일링했어요. 스케일링해야 할 변수가 아주 많다면, 각 변수마다 수백 줄의 코드를 쓰고 싶지는 않으실 거예요. 이전 연습 문제를 확장해 이를 함수로 만들어 봅시다.

Instructions

100 XP
  • min_max_scaler라는 함수를 정의하고, 매개변수로 스케일링할 데이터프레임 df와 열 이름 목록 cols_to_scale를 받도록 하세요.
  • for 루프를 사용해 목록의 각 열을 순회하면서 MinMax 스케일링을 적용하세요.
  • 새 열이 추가된 데이터프레임 df를 반환하세요.
  • 함수 min_max_scaler()를 df와 열 목록 cols_to_scale에 적용하세요.