Transformar y limpiar DataFrames
Una vez que los datos se han depurado en una estructura de datos de Python limpia, como una lista de listas, es fácil convertirlos en un DataFrame de pandas. Practicarás justamente esto con los datos que preparaste en el ejercicio anterior.
Como de costumbre, pandas se ha importado como pd, y la variable normalized_testing_scores almacena la lista con los datos de evaluación de cada escuela, como se muestra a continuación.
[
['01M539', '111 Columbia Street', 'Manhattan', 657.0, 601.0, 601.0],
...
]
Este ejercicio forma parte del curso
ETL and ELT con Python
Instrucciones del ejercicio
- Crea un DataFrame de
pandasa partir de la lista de listas almacenada en la variablenormalized_testing_scores. - Define los nombres de las columnas para el DataFrame
normalized_data.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create a DataFrame from the normalized_testing_scores list
normalized_data = ____(normalized_testing_scores)
# Set the column names
normalized_data.____ = ["school_id", "street_address", "city", "avg_score_math", "avg_score_reading", "avg_score_writing"]
normalized_data = normalized_data.set_index("school_id")
print(normalized_data.head())