Datetimes aus mehreren Spalten erstellen
Manchmal sind Datum-und-Uhrzeit-Daten auf mehrere Spalten verteilt. Ein Datensatz kann zum Beispiel eine Datums- und eine Zeitspalte haben, oder ein Datum ist in die Spalten Jahr, Monat und Tag aufgeteilt.
In dieser Version der Umfragedaten wurde eine Spalte so aufgesplittet, dass die Daten in einer Spalte Part2StartDate und die Zeiten in einer anderen Spalte Part2StartTime stehen. Deine Aufgabe ist es, mit dem Argument parse_dates von read_excel() beide zu einer einzelnen Datetime-Spalte mit einem neuen Namen zu kombinieren.
pandas ist als pd importiert.
Diese Übung ist Teil des Kurses
<Kurs>Vereinfachte Datenaufnahme mit pandas</Kurs>Übungsanweisungen
- Erstelle ein Dictionary
datetime_cols, das angibt, dass die neue SpaltePart2StartausPart2StartDateundPart2StartTimebestehen soll. - Lade die Datei mit den Umfrageantworten und übergib das Dictionary an das Argument
parse_dates, um die neue SpaltePart2Startzu erstellen. - Lass dir mit der Methode
describe()die zusammenfassenden Statistiken zur neuen SpaltePart2Startanzeigen.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create dict of columns to combine into new datetime column
datetime_cols = {"Part2Start": ____}
# Load file, supplying the dict to parse_dates
survey_data = pd.read_excel("fcc_survey_dts.xlsx",
____)
# View summary statistics about Part2Start
print(survey_data.Part2Start.describe())