Explora los datos de train
Vas a trabajar con otra competición de Kaggle llamada "Store Item Demand Forecasting Challenge". En esta competición, te dan 5 años de datos de ventas por tienda y artículo, y te piden predecir 3 meses de ventas para 50 artículos diferentes en 10 tiendas distintas.
Para empezar, exploremos los datos de train de esta competición. Para mejorar el rendimiento, trabajarás con un subconjunto de los datos de train que contiene solo el historial de un mes.
Tu objetivo inicial es leer los datos de entrada y echarles un primer vistazo.
Este ejercicio forma parte del curso
Cómo ganar una competición de Kaggle con Python
Instrucciones del ejercicio
- Importa
pandascomopd. - Lee los datos de train usando el método
read_csv()depandas. - Imprime la cabecera de los datos de train (usando el método
head()) para ver una muestra de los datos.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import pandas
import ____ as pd
# Read train data
train = pd.____('train.csv')
# Look at the shape of the data
print('Train shape:', train.shape)
# Look at the head() of the data
print(train.____())