Erste SchritteKostenlos loslegen

List Comprehensions für zeitgestempelte Daten

Du wirst nun das Gelernte aus diesem Kapitel anwenden, um ein einfaches Problem der Datenextraktion zu lösen. In dieser Aufgabe lernst du auch eine Datenstruktur kennen, die Series von pandas. Wir werden hier nicht näher darauf eingehen, aber du solltest wissen, dass es sich um eine Datenstruktur handelt, mit der du häufig arbeiten wirst, wenn du Daten aus pandas-DataFrames analysierst. Du kannst dir die Spalten des DataFrame als eindimensionale Arrays vorstellen, die Series genannt werden.

In dieser Aufgabe verwendest du eine List Comprehension, um die Zeit aus Twitter-Daten mit Zeitstempeln zu extrahieren. Das pandas-Paket wurde als pd importiert und die Datei 'tweets.csv' wurde als DataFrame df für dich importiert.

Diese Übung ist Teil des Kurses

Python Toolbox

Kurs anzeigen

Anleitung zur Übung

  • Extrahiere die Spalte 'created_at' aus df und weise das Ergebnis tweet_time zu. Hinweis: Die extrahierte Spalte in tweet_time ist eine Series-Datenstruktur!
  • Erstelle eine List Comprehension, die die Zeit aus jeder Zeile in tweet_time extrahiert. Jede Zeile ist ein String, der einen Zeitstempel darstellt, und du greifst auf das 12. bis 19. Zeichen des Strings zu, um die Zeit zu extrahieren. Verwende entry als Iteratorvariable und weise das Ergebnis tweet_clock_time zu. Denke daran, dass Python eine 0-basierte Indexierung verwendet!

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

# Extract the created_at column from df: tweet_time
tweet_time = ____

# Extract the clock time: tweet_clock_time
tweet_clock_time = [____]

# Print the extracted times
print(tweet_clock_time)
Bearbeiten und Ausführen von Code