Aan de slagGa gratis aan de slag

DataFrames transformeren en opschonen

Zodra gegevens zijn samengebracht in een opgeschoonde Python-datastructuur, zoals een lijst van lijsten, kun je die eenvoudig omzetten naar een pandas DataFrame. Je gaat dit oefenen met de data die je in de vorige oefening hebt samengesteld.

Zoals gebruikelijk is pandas geïmporteerd als pd, en de variabele normalized_testing_scores bevat de lijst met de toetsgegevens per school, zoals hieronder weergegeven.

[
    ['01M539', '111 Columbia Street', 'Manhattan', 657.0, 601.0, 601.0],
    ...
]   

Deze oefening maakt deel uit van de cursus

ETL en ELT in Python

Cursus bekijken

Oefeninstructies

  • Maak een pandas DataFrame van de lijst van lijsten in de variabele normalized_testing_scores.
  • Stel de kolomnamen in voor het normalized_data DataFrame.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create a DataFrame from the normalized_testing_scores list
normalized_data = ____(normalized_testing_scores)

# Set the column names
normalized_data.____ = ["school_id", "street_address", "city", "avg_score_math", "avg_score_reading", "avg_score_writing"]

normalized_data = normalized_data.set_index("school_id")
print(normalized_data.head())
Code bewerken en uitvoeren