1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 Machine Learning 특성 공학

Connected

연습 문제

데이터는 어떤 모습인가요? (I)

지금까지는 새로운 특성을 만들고 데이터의 문제를 다루는 데 집중했어요. 특성 공학은 이미 가지고 있는 데이터를 최대한 활용하고, Machine Learning 모델을 만들 때 더 효과적으로 사용할 수 있도록 도와줘요.
많은 알고리즘은 데이터가 정규분포를 따른다고 가정하거나, 최소한 모든 열이 같은 스케일에 있다고 가정해요. 하지만 실제로는 그렇지 않은 경우가 많아요. 예를 들어, 어떤 특성은 수천 달러 단위로, 다른 특성은 연수로 측정될 수 있어요. 이 연습 문제에서는 so_survey_df DataFrame에서 숫자형 열만 모아 둔 so_numeric_df의 몇몇 수치형 열 분포를 확인하기 위해 그래프를 만들어 볼 거예요.

지침 1/3

undefined XP
    1
    2
    3

so_numeric_df DataFrame의 모든 열에 대한 히스토그램을 생성하세요.