Criação de variáveis independentes
Neste capítulo, você vai trabalhar com um conjunto de dados chamado sales_df
, que contém informações sobre gastos com campanhas publicitárias em diferentes tipos de mídia e o valor gerado nas vendas com a respectiva campanha. O conjunto de dados foi pré-carregado para você. Estas são as duas primeiras linhas:
tv radio social_media sales
1 13000.0 9237.76 2409.57 46677.90
2 41000.0 15886.45 2913.41 150177.83
Você usará as despesas com publicidade como variáveis independentes para prever os valores de vendas, trabalhando inicialmente com a coluna "radio"
. No entanto, antes de fazer qualquer previsão, você precisa criar as matrizes de variáveis independentes e da variável dependente, remodelando-as com o formato correto do scikit-learn.
Este exercício faz parte do curso
Aprendizado Supervisionado com o scikit-learn
Instruções de exercício
- Crie
X
, uma matriz dos valores da coluna"radio"
do DataFramesales_df
. - Crie
y
, uma matriz dos valores da coluna"sales"
do DataFramesales_df
. - Remodele
X
como uma matriz bidimensional do NumPy. - Imprima a forma de
X
ey
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
import numpy as np
# Create X from the radio column's values
X = ____
# Create y from the sales column's values
y = ____
# Reshape X
X = ____
# Check the shape of the features and targets
print(____)