Explorar os dados de treino
Você vai trabalhar com outra competição do Kaggle chamada "Store Item Demand Forecasting Challenge". Nessa competição, você recebe 5 anos de dados de vendas por item e loja, e precisa prever 3 meses de vendas para 50 itens diferentes em 10 lojas diferentes.
Para começar, vamos explorar os dados de treino desta competição. Para ter um desempenho mais rápido, você vai trabalhar com um subconjunto dos dados de treino contendo apenas o histórico de um mês.
Seu objetivo inicial é ler os dados de entrada e dar a primeira olhada neles.
Este exercício faz parte do curso
Vencendo uma competição do Kaggle em Python
Instruções do exercício
- Importe
pandascomopd. - Leia os dados de treino usando o método
read_csv()dopandas. - Imprima o head dos dados de treino (usando o método
head()) para ver uma amostra dos dados.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import pandas
import ____ as pd
# Read train data
train = pd.____('train.csv')
# Look at the shape of the data
print('Train shape:', train.shape)
# Look at the head() of the data
print(train.____())