Haal datetimes uit meerdere kolommen
Soms is datetime-gegevens verdeeld over meerdere kolommen. Een gegevensset kan bijvoorbeeld een datum- en een tijdkolom hebben, of een datum kan zijn opgesplitst in aparte kolommen voor jaar, maand en dag.
In deze versie van de enquêtedata is een kolom opgesplitst: datums staan in één kolom, Part2StartDate, en tijden in een andere, Part2StartTime. Je taak is om met het parse_dates-argument van read_excel() deze te combineren tot één datetime-kolom met een nieuwe naam.
pandas is al geïmporteerd als pd.
Deze oefening maakt deel uit van de cursus
Gestroomlijnde data-inname met pandas
Oefeninstructies
- Maak een dictionary,
datetime_cols, die aangeeft dat de nieuwe kolomPart2Startmoet bestaan uitPart2StartDateenPart2StartTime. - Laad het bestand met enquêteresultaten en geef de dictionary mee aan het
parse_dates-argument om een nieuwe kolomPart2Startte maken. - Bekijk samenvattende statistieken van de nieuwe kolom
Part2Startmet de methodedescribe().
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create dict of columns to combine into new datetime column
datetime_cols = {"Part2Start": ____}
# Load file, supplying the dict to parse_dates
survey_data = pd.read_excel("fcc_survey_dts.xlsx",
____)
# View summary statistics about Part2Start
print(survey_data.Part2Start.describe())