ComeçarComece gratuitamente

Criação de variáveis independentes

Neste capítulo, você vai trabalhar com um conjunto de dados chamado sales_df, que contém informações sobre gastos com campanhas publicitárias em diferentes tipos de mídia e o valor gerado nas vendas com a respectiva campanha. O conjunto de dados foi pré-carregado para você. Estas são as duas primeiras linhas:

     tv        radio      social_media    sales

1    13000.0   9237.76    2409.57         46677.90
2    41000.0   15886.45   2913.41         150177.83

Você usará as despesas com publicidade como variáveis independentes para prever os valores de vendas, trabalhando inicialmente com a coluna "radio". No entanto, antes de fazer qualquer previsão, você precisa criar as matrizes de variáveis independentes e da variável dependente, remodelando-as com o formato correto do scikit-learn.

Este exercício faz parte do curso

Aprendizado Supervisionado com o scikit-learn

Ver Curso

Instruções de exercício

  • Crie X, uma matriz dos valores da coluna "radio" do DataFrame sales_df.
  • Crie y, uma matriz dos valores da coluna "sales" do DataFrame sales_df.
  • Remodele X como uma matriz bidimensional do NumPy.
  • Imprima a forma de X e y.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

import numpy as np

# Create X from the radio column's values
X = ____

# Create y from the sales column's values
y = ____

# Reshape X
X = ____

# Check the shape of the features and targets
print(____)
Editar e executar código