List Comprehensions für zeitgestempelte Daten
Du wirst nun das Gelernte aus diesem Kapitel anwenden, um ein einfaches Problem der Datenextraktion zu lösen. In dieser Aufgabe lernst du auch eine Datenstruktur kennen, die Series von pandas. Wir werden hier nicht näher darauf eingehen, aber du solltest wissen, dass es sich um eine Datenstruktur handelt, mit der du häufig arbeiten wirst, wenn du Daten aus pandas-DataFrames analysierst. Du kannst dir die Spalten des DataFrame als eindimensionale Arrays vorstellen, die Series genannt werden.
In dieser Aufgabe verwendest du eine List Comprehension, um die Zeit aus Twitter-Daten mit Zeitstempeln zu extrahieren. Das pandas-Paket wurde als pd
importiert und die Datei 'tweets.csv'
wurde als DataFrame df
für dich importiert.
Diese Übung ist Teil des Kurses
Python Toolbox
Anleitung zur Übung
- Extrahiere die Spalte
'created_at'
ausdf
und weise das Ergebnistweet_time
zu. Hinweis: Die extrahierte Spalte intweet_time
ist eine Series-Datenstruktur! - Erstelle eine List Comprehension, die die Zeit aus jeder Zeile in
tweet_time
extrahiert. Jede Zeile ist ein String, der einen Zeitstempel darstellt, und du greifst auf das 12. bis 19. Zeichen des Strings zu, um die Zeit zu extrahieren. Verwendeentry
als Iteratorvariable und weise das Ergebnistweet_clock_time
zu. Denke daran, dass Python eine 0-basierte Indexierung verwendet!
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Extract the created_at column from df: tweet_time
tweet_time = ____
# Extract the clock time: tweet_clock_time
tweet_clock_time = [____]
# Print the extracted times
print(tweet_clock_time)