Listen-Abstraktionen für zeitgestempelte Daten
Du wirst nun das Gelernte aus diesem Kapitel anwenden, um ein einfaches Problem der Datenextraktion zu lösen. Außerdem lernst du in dieser Aufgabe eine Datenstruktur kennen, die Series von pandas. Dabei handelt es sich um eine Datenstruktur, mit der du häufig arbeiten wirst, wenn du Daten aus pandas-DataFrames analysierst. Du kannst dir die Spalten des DataFrame als eindimensionale Arrays vorstellen – Series genannt.
In dieser Aufgabe verwendest du eine Listen-Abstraktion, um die Zeit aus zeitgestempelten Twitter-Daten zu extrahieren. Das pandas-Paket wurde als pd importiert und die Datei 'tweets.csv' wurde als DataFrame df für dich importiert.
Diese Übung ist Teil des Kurses
Python Toolbox
Anleitung zur Übung
- Extrahiere die Spalte
'created_at'ausdfund weise das Ergebnistweet_timezu. Hinweis: Die extrahierte Spalte intweet_timeist eine Series-Datenstruktur! - Erstelle eine Listen-Abstraktion, die die Zeit aus jeder Zeile in
tweet_timeextrahiert. Jede Zeile ist ein String, der einen Zeitstempel darstellt, und du greifst auf das 12. bis 19. Zeichen des Strings zu, um die Zeit zu extrahieren. Verwendeentryals Iterator-Variable und weise das Ergebnistweet_clock_timezu. Denke daran, dass Python eine 0-basierte Indexierung verwendet!
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Extract the created_at column from df: tweet_time
tweet_time = ____
# Extract the clock time: tweet_clock_time
tweet_clock_time = [____]
# Print the extracted times
print(tweet_clock_time)