Een bestand in stukken importeren

Als je met grote bestanden werkt, is het vaak handiger om de data in stukken te laden en te verwerken. Oefen deze werkwijze met de belastingdata van Vermont.

De eerste 500 rijen zijn geladen als vt_data_first500. Jij haalt de volgende 500 rijen op. Hiervoor gebruik je een aantal keyword-argumenten: nrows en skiprows om de juiste records te pakken, header om pandas te laten weten dat de data geen kolomnamen heeft, en names om de ontbrekende kolomnamen aan te leveren. Gebruik ook de functie list() om de kolomnamen uit vt_data_first500 te halen en te hergebruiken.

pandas is geïmporteerd als pd.

Deze oefening maakt deel uit van de cursus

Gestroomlijnde data-inname met pandas

Bekijk cursus

Oefeninstructies

Gebruik nrows en skiprows om een dataframe, vt_data_next500, te maken met de volgende 500 rijen.
Stel het header-argument zo in dat pandas weet dat er geen header-rij is.
Geef de kolommen in vt_data_next500 een naam door een lijst met kolommen van vt_data_first500 aan het names-argument te leveren.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Create dataframe of next 500 rows with labeled columns
vt_data_next500 = pd.read_csv("vt_tax_data_2016.csv", 
                       		  ____,
                       		  ____,
                       		  ____,
                       		  ____)

# View the Vermont dataframes to confirm they're different
print(vt_data_first500.head())
print(vt_data_next500.head())

Code bewerken en uitvoeren