Eenvoudige datums parsen
pandas leidt niet af dat kolommen datetime-gegevens bevatten; het ziet ze als object- of tekenreeksgegevens, tenzij je iets anders aangeeft. Datums en tijden goed modelleren is eenvoudig als ze in een standaardformaat staan — we kunnen het argument parse_dates gebruiken om read_excel() te vertellen dat kolommen als datetime-gegevens moeten worden ingelezen.
De New Developer Survey-responses bevatten een paar kolommen met timestamps die makkelijk te parsen zijn. In deze oefening zorg je ervoor dat ze het juiste gegevenstype hebben.
pandas is geladen als pd.
Deze oefening maakt deel uit van de cursus
Gestroomlijnde data-inname met pandas
Oefeninstructies
- Laad
fcc_survey.xlsxen zorg ervoor dat de kolomPart1StartTimewordt geparsed als datetime-gegevens. - Bekijk de eerste paar waarden van
survey_data.Part1StartTimeom te controleren dat het datetimes bevat.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load file, with Part1StartTime parsed as datetime data
survey_data = pd.read_excel("fcc_survey.xlsx",
____)
# Print first few values of Part1StartTime
print(survey_data.Part1StartTime.____)