Transformar y limpiar DataFrames
Una vez que los datos se han curado en una estructura de datos Python limpia, como una lista de listas, es fácil convertirla en un DataFrame pandas
. Practicarás haciendo esto con los datos que se curaron en el último ejercicio.
Como de costumbre, pandas
se ha importado como pd
, y la variable normalized_testing_scores
almacena la lista de datos de las pruebas de cada escuela, como se muestra a continuación.
[
['01M539', '111 Columbia Street', 'Manhattan', 657.0, 601.0, 601.0],
...
]
Este ejercicio forma parte del curso
Introducción a las canalizaciones de datos
Instrucciones de ejercicio
- Crea un DataFrame
pandas
a partir de la lista de listas almacenadas en la variablenormalized_testing_scores
. - Establece los nombres de las columnas del Marco de Datos
normalized_data
.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Create a DataFrame from the normalized_testing_scores list
normalized_data = ____(normalized_testing_scores)
# Set the column names
normalized_data.____ = ["school_id", "street_address", "city", "avg_score_math", "avg_score_reading", "avg_score_writing"]
normalized_data = normalized_data.set_index("school_id")
print(normalized_data.head())