Validar las transformaciones de datos
¡Gran trabajo hasta ahora! Comprobar manualmente las transformaciones es un gran primer paso para asegurarte de que mantienes la calidad de los datos en todo el proceso. pandas
ofrece varias funciones integradas que te ayudarán a hacerlo.
Para ayudarte a empezar con este ejercicio, se ha importado pandas
como pd
.
Este ejercicio forma parte del curso
Introducción a las canalizaciones de datos
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
def extract(file_path):
# Ingest the data to a DataFrame
raw_data = pd.____(____)
# Return the DataFrame
return raw_data
raw_sales_data = extract("sales_data.parquet")