1. Nauka
  2. /
  3. Kursy
  4. /
  5. Zestaw narzędzi Pythona

Connected

ćwiczenie

Listy składane dla danych z sygnaturą czasową

Teraz wykorzystasz wiedzę zdobytą w tym rozdziale, żeby rozwiązać prosty problem ekstrakcji danych. Poznasz przy okazji nową strukturę danych – pandas Series. Nie będziemy jej tu szczegółowo omawiać, ale warto wiedzieć, że to struktura, z którą bardzo często będziesz pracować podczas analizy danych z DataFrames w pandas. Możesz myśleć o kolumnach DataFrame'u jako o jednowymiarowych tablicach zwanych Series.

W tym ćwiczeniu użyjesz listy składanej, żeby wyodrębnić czas z danych Twittera opatrzonych sygnaturą czasową. Pakiet pandas został zaimportowany jako pd, a plik 'tweets.csv' – jako DataFrame df.

Instrukcje

100 XP
  • Wyodrębnij kolumnę 'created_at' z DataFrame'u df i przypisz wynik do zmiennej tweet_time. Ciekawostka: wyodrębniona kolumna w tweet_time to struktura danych typu Series!
  • Utwórz listę składaną, która wyodrębni czas z każdego wiersza w tweet_time. Każdy wiersz to ciąg znaków reprezentujący sygnaturę czasową – żeby wyodrębnić czas, pobierz znaki od 12. do 19. włącznie. Użyj entry jako zmiennej iteratora i przypisz wynik do tweet_clock_time. Pamiętaj, że Python używa indeksowania od zera!