1. 학습
  2. /
  3. 강의
  4. /
  5. scikit-learn으로 배우는 지도 학습

Connected

연습 문제

피처 생성하기

이번 챕터에서는 sales_df 데이터셋을 사용합니다. 이 데이터셋에는 다양한 미디어 유형별 광고 캠페인 지출 정보와 각 캠페인에서 발생한 판매 금액(달러)이 포함되어 있습니다. 데이터셋은 미리 로드되어 있으며, 처음 두 행은 다음과 같습니다.

     tv        radio      social_media    sales
1    13000.0   9237.76    2409.57         46677.90
2    41000.0   15886.45   2913.41         150177.83

광고 지출 데이터를 피처로 사용하여 판매 금액을 예측할 것입니다. 먼저 "radio" 열을 사용해 시작합니다. 예측을 수행하기 전에 피처 배열과 타깃 배열을 생성하고, scikit-learn에 맞는 형태로 변환해야 합니다.

지침

100 XP
  • X DataFrame의 sales_df 열 값으로 배열 "radio"를 생성하세요.
  • y DataFrame의 sales_df 열 값으로 배열 "sales"를 생성하세요.
  • X를 2차원 NumPy 배열로 변환하세요.
  • X와 y의 형태(shape)를 출력하세요.