1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Python Toolbox

Connected

Cvičení

List comprehensions pro data s časovými razítky

Teď využiješ, co ses v této kapitole naučil/a, k jednoduchému úkolu extrakce dat. Zároveň tě seznámíme s datovou strukturou Series z knihovny pandas. Nebudeme zacházet do velkých podrobností, ale důležité je vědět, že jde o strukturu, se kterou budeš při práci s pandas DataFrames pracovat velmi často. Sloupce DataFramu si můžeš představit jako jednorozměrná pole nazývaná Series.

V tomto cvičení použiješ list comprehension k extrakci času z dat z Twitteru s časovými razítky. Knihovna pandas je importovaná jako pd a soubor 'tweets.csv' je načtený jako DataFrame df.

Pokyny

100 XP
  • Extrahuj sloupec 'created_at' z df a výsledek přiřaď do proměnné tweet_time. Zajímavost: extrahovaný sloupec v tweet_time je datová struktura Series!
  • Vytvoř list comprehension, který z každého řádku v tweet_time extrahuje čas. Každý řádek je řetězec reprezentující časové razítko – čas získáš tak, že vybereš znaky na pozicích 12 až 19. Jako iterační proměnnou použij entry a výsledek přiřaď do tweet_clock_time. Nezapomeň, že Python indexuje od nuly!