Aan de slagGa gratis aan de slag

Haal datetimes uit meerdere kolommen

Soms is datetime-gegevens verdeeld over meerdere kolommen. Een gegevensset kan bijvoorbeeld een datum- en een tijdkolom hebben, of een datum kan zijn opgesplitst in aparte kolommen voor jaar, maand en dag.

In deze versie van de enquêtedata is een kolom opgesplitst: datums staan in één kolom, Part2StartDate, en tijden in een andere, Part2StartTime. Je taak is om met het parse_dates-argument van read_excel() deze te combineren tot één datetime-kolom met een nieuwe naam.

pandas is al geïmporteerd als pd.

Deze oefening maakt deel uit van de cursus

Gestroomlijnde data-inname met pandas

Cursus bekijken

Oefeninstructies

  • Maak een dictionary, datetime_cols, die aangeeft dat de nieuwe kolom Part2Start moet bestaan uit Part2StartDate en Part2StartTime.
  • Laad het bestand met enquêteresultaten en geef de dictionary mee aan het parse_dates-argument om een nieuwe kolom Part2Start te maken.
  • Bekijk samenvattende statistieken van de nieuwe kolom Part2Start met de methode describe().

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create dict of columns to combine into new datetime column
datetime_cols = {"Part2Start": ____}


# Load file, supplying the dict to parse_dates
survey_data = pd.read_excel("fcc_survey_dts.xlsx",
                            ____)

# View summary statistics about Part2Start
print(survey_data.Part2Start.describe())
Code bewerken en uitvoeren