Transformar datos de ventas con pandas
Antes de poder extraer información de un conjunto de datos, puede ser necesario modificar los tipos de columna para aprovechar adecuadamente los datos. Esto es especialmente habitual con los tipos de datos temporales, que pueden almacenarse de varias formas distintas.
Para este ejemplo, pandas
se ha importado como pd
y está listo para que lo utilices.
Este ejercicio forma parte del curso
Introducción a las canalizaciones de datos
Instrucciones de ejercicio
- Actualiza la función
transform()
para convertir los datos de la columna"Order Date"
al tipodatetime
. - Filtra el DataFrame para que sólo contenga filas con
"Price Each"
inferiores a diez dólares. - Imprime los tipos de datos de cada columna del Marco de datos.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
raw_sales_data = extract("sales_data.csv")
def transform(raw_data):
# Convert the "Order Date" column to type datetime
raw_data["Order Date"] = pd.____(____, format="%m/%d/%y %H:%M")
# Only keep items under ten dollars
clean_data = raw_data.loc[____, :]
return clean_data
clean_sales_data = transform(raw_sales_data)
# Check the data types of each column
print(____)