1. सीखें
  2. /
  3. पाठ्यक्रम
  4. /
  5. scikit-learn으로 배우는 Supervised Learning

Connected

अभ्यास

특성 만들기

이번 장에서는 sales_df라는 데이터셋을 사용합니다. 이 데이터셋에는 매체 유형별 광고 캠페인 지출 정보와 해당 캠페인으로 발생한 매출(달러)이 담겨 있습니다. 데이터셋은 이미 로드되어 있어요. 처음 두 행은 다음과 같습니다:

     tv        radio      social_media    sales
1    13000.0   9237.76    2409.57         46677.90
2    41000.0   15886.45   2913.41         150177.83

광고 지출을 특성으로 사용해 매출을 예측할 예정이며, 먼저 "radio" 열부터 시작합니다. 예측을 수행하기 전에, scikit-learn에 맞는 올바른 형식이 되도록 특성 배열과 타깃 배열을 만들고 reshape해야 합니다.

निर्देश

100 XP
  • sales_df DataFrame의 "radio" 열 값으로 이루어진 배열 X를 생성하세요.
  • sales_df DataFrame의 "sales" 열 값으로 이루어진 배열 y를 생성하세요.
  • X를 2차원 NumPy 배열로 reshape하세요.
  • X와 y의 shape을 출력하세요.