CommencerCommencer gratuitement

Transformer et nettoyer les DataFrame

Une fois que les données ont été classées dans une structure de données Python propre, telle qu'une liste de listes, il est facile de les convertir en un DataFrame pandas. Vous vous entraînerez à le faire avec les données qui ont été traitées dans le dernier exercice.

Comme d'habitude, pandas a été importé en tant que pd, et la variable normalized_testing_scores contient la liste des données de test de chaque école, comme indiqué ci-dessous.

[
    ['01M539', '111 Columbia Street', 'Manhattan', 657.0, 601.0, 601.0],
    ...
]   

Cet exercice fait partie du cours

ETL et ELT en Python

Afficher le cours

Instructions

  • Créez un DataFrame pandas à partir de la liste des listes stockées dans la variable normalized_testing_scores.
  • Définissez les noms des colonnes du DataFrame normalized_data.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create a DataFrame from the normalized_testing_scores list
normalized_data = ____(normalized_testing_scores)

# Set the column names
normalized_data.____ = ["school_id", "street_address", "city", "avg_score_math", "avg_score_reading", "avg_score_writing"]

normalized_data = normalized_data.set_index("school_id")
print(normalized_data.head())
Modifier et exécuter le code