Transformer et nettoyer les DataFrame
Une fois que les données ont été classées dans une structure de données Python propre, telle qu'une liste de listes, il est facile de les convertir en un DataFrame pandas
. Vous vous entraînerez à le faire avec les données qui ont été traitées dans le dernier exercice.
Comme d'habitude, pandas
a été importé en tant que pd
, et la variable normalized_testing_scores
contient la liste des données de test de chaque école, comme indiqué ci-dessous.
[
['01M539', '111 Columbia Street', 'Manhattan', 657.0, 601.0, 601.0],
...
]
Cet exercice fait partie du cours
ETL et ELT en Python
Instructions
- Créez un DataFrame
pandas
à partir de la liste des listes stockées dans la variablenormalized_testing_scores
. - Définissez les noms des colonnes du DataFrame
normalized_data
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a DataFrame from the normalized_testing_scores list
normalized_data = ____(normalized_testing_scores)
# Set the column names
normalized_data.____ = ["school_id", "street_address", "city", "avg_score_math", "avg_score_reading", "avg_score_writing"]
normalized_data = normalized_data.set_index("school_id")
print(normalized_data.head())