CommencerCommencez gratuitement

Transformer et nettoyer les DataFrames

Une fois que les données ont été classées dans une structure de données Python propre, telle qu'une liste de listes, il est facile de les convertir en un DataFrame pandas. Vous vous entraînerez à le faire avec les données qui ont été traitées dans le dernier exercice.

Comme d'habitude, pandas a été importé en tant que pd, et la variable normalized_testing_scores contient la liste des données de test de chaque école, comme indiqué ci-dessous.

[

    ['01M539', '111 Columbia Street', 'Manhattan', 657.0, 601.0, 601.0],

    ...

]   

Cet exercice fait partie du cours

<cours>ETL et ELT en Python</cours>
Voir le cours

Instructions de l’exercice

  • Créez un DataFrame pandas à partir de la liste des listes stockées dans la variable normalized_testing_scores.
  • Définissez les noms des colonnes du DataFrame normalized_data.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Create a DataFrame from the normalized_testing_scores list
normalized_data = ____(normalized_testing_scores)

# Set the column names
normalized_data.____ = ["school_id", "street_address", "city", "avg_score_math", "avg_score_reading", "avg_score_writing"]

normalized_data = normalized_data.set_index("school_id")
print(normalized_data.head())
Modifier et exécuter le code