LoslegenKostenlos loslegen

Listen-Abstraktionen für zeitgestempelte Daten

Du wirst nun das Gelernte aus diesem Kapitel anwenden, um ein einfaches Problem der Datenextraktion zu lösen. Außerdem lernst du in dieser Aufgabe eine Datenstruktur kennen, die Series von pandas. Dabei handelt es sich um eine Datenstruktur, mit der du häufig arbeiten wirst, wenn du Daten aus pandas-DataFrames analysierst. Du kannst dir die Spalten des DataFrame als eindimensionale Arrays vorstellen – Series genannt.

In dieser Aufgabe verwendest du eine Listen-Abstraktion, um die Zeit aus zeitgestempelten Twitter-Daten zu extrahieren. Das pandas-Paket wurde als pd importiert und die Datei 'tweets.csv' wurde als DataFrame df für dich importiert.

Diese Übung ist Teil des Kurses

Python Toolbox

Kurs anzeigen

Anleitung zur Übung

  • Extrahiere die Spalte 'created_at' aus df und weise das Ergebnis tweet_time zu. Hinweis: Die extrahierte Spalte in tweet_time ist eine Series-Datenstruktur!
  • Erstelle eine Listen-Abstraktion, die die Zeit aus jeder Zeile in tweet_time extrahiert. Jede Zeile ist ein String, der einen Zeitstempel darstellt, und du greifst auf das 12. bis 19. Zeichen des Strings zu, um die Zeit zu extrahieren. Verwende entry als Iterator-Variable und weise das Ergebnis tweet_clock_time zu. Denke daran, dass Python eine 0-basierte Indexierung verwendet!

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Extract the created_at column from df: tweet_time
tweet_time = ____

# Extract the clock time: tweet_clock_time
tweet_clock_time = [____]

# Print the extracted times
print(tweet_clock_time)
Code bearbeiten und ausführen