List Comprehensions für zeitgestempelte Daten
Du wirst nun das Gelernte aus diesem Kapitel anwenden, um ein einfaches Problem der Datenextraktion zu lösen. In dieser Aufgabe lernst du auch eine Datenstruktur kennen, die Series von pandas. Wir werden hier nicht näher darauf eingehen, aber du solltest wissen, dass es sich um eine Datenstruktur handelt, mit der du häufig arbeiten wirst, wenn du Daten aus pandas-DataFrames analysierst. Du kannst dir die Spalten des DataFrame als eindimensionale Arrays vorstellen, die Series genannt werden.
In dieser Aufgabe verwendest du eine List Comprehension, um die Zeit aus Twitter-Daten mit Zeitstempeln zu extrahieren. Das pandas-Paket wurde als pd importiert und die Datei 'tweets.csv' wurde als DataFrame df für dich importiert.
Diese Übung ist Teil des Kurses
Python Toolbox
Anleitung zur Übung
- Extrahiere die Spalte
'created_at'ausdfund weise das Ergebnistweet_timezu. Hinweis: Die extrahierte Spalte intweet_timeist eine Series-Datenstruktur! - Erstelle eine List Comprehension, die die Zeit aus jeder Zeile in
tweet_timeextrahiert. Jede Zeile ist ein String, der einen Zeitstempel darstellt, und du greifst auf das 12. bis 19. Zeichen des Strings zu, um die Zeit zu extrahieren. Verwendeentryals Iteratorvariable und weise das Ergebnistweet_clock_timezu. Denke daran, dass Python eine 0-basierte Indexierung verwendet!
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Extract the created_at column from df: tweet_time
tweet_time = ____
# Extract the clock time: tweet_clock_time
tweet_clock_time = [____]
# Print the extracted times
print(tweet_clock_time)