1. 학습
  2. /
  3. 강의
  4. /
  5. PySpark로 하는 Feature Engineering

Connected

연습 문제

우리는 무엇을 예측하나요?

다음 필드(열) 중에서 우리가 예측하려는 값은 무엇인가요?

  • TAXES
  • SALESCLOSEPRICE
  • DAYSONMARKET
  • LISTPRICE

지침

100 XP
  • 위에 나열된 열 중에서 우리가 종속 변수 $Y$로 사용할 열을 선택하세요.
  • 불러온 데이터셋 df에서 select()를 사용해 종속 변수만 남기세요. 이 데이터프레임을 변수 Y_df에 저장하세요.
  • Y_df에 대해 describe()를 호출하고 show()로 출력해 종속 변수의 요약 통계를 확인하세요.