DataFrames transformeren en opschonen
Zodra gegevens zijn samengebracht in een opgeschoonde Python-datastructuur, zoals een lijst van lijsten, kun je die eenvoudig omzetten naar een pandas DataFrame. Je gaat dit oefenen met de data die je in de vorige oefening hebt samengesteld.
Zoals gebruikelijk is pandas geïmporteerd als pd, en de variabele normalized_testing_scores bevat de lijst met de toetsgegevens per school, zoals hieronder weergegeven.
[
['01M539', '111 Columbia Street', 'Manhattan', 657.0, 601.0, 601.0],
...
]
Deze oefening maakt deel uit van de cursus
ETL en ELT in Python
Oefeninstructies
- Maak een
pandasDataFrame van de lijst van lijsten in de variabelenormalized_testing_scores. - Stel de kolomnamen in voor het
normalized_dataDataFrame.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a DataFrame from the normalized_testing_scores list
normalized_data = ____(normalized_testing_scores)
# Set the column names
normalized_data.____ = ["school_id", "street_address", "city", "avg_score_math", "avg_score_reading", "avg_score_writing"]
normalized_data = normalized_data.set_index("school_id")
print(normalized_data.head())