Sla slechte data over
In deze oefening gebruik je parameters van read_csv() om bestanden met slechte data af te handelen, zoals records met meer waarden dan kolommen. Standaard zorgt het proberen te importeren van zulke bestanden voor een specifieke fout: pandas.errors.ParserError.
Sommige regels in de Vermont-belastingsdata hier zijn beschadigd. Om de goede regels te laden, moeten we pandas vertellen om fouten over te slaan. We willen ook dat pandas ons waarschuwt wanneer het een regel overslaat, zodat we weten hoe groot het dataprobleem is.
pandas is geïmporteerd als pd. De oefen-code zal proberen het bestand te lezen. Als er een pandas.errors.ParserError optreedt, wordt de code in het except-blok uitgevoerd.
Deze oefening maakt deel uit van de cursus
Gestroomlijnde data-inname met pandas
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
try:
# Import the CSV without any keyword arguments
data = ____
# View first 5 records
print(data.head())
except pd.errors.ParserError:
print("Your data contained rows that could not be parsed.")