1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Analýza dat ze sociálních sítí v Pythonu

Connected

cvičení

Načtení tweetů do DataFrame

Teď přišel čas načíst data do pandas DataFrame, abychom mohli analyzovat tweety ve větším měřítku.

Budeme pracovat s datasetem tweetů obsahujících hashtag '#rstats' nebo '#python'. Tento dataset je uložen jako seznam tweet JSON objektů v proměnné data_science_json.

Tento kurz se dotýká mnoha konceptů, na které možná nemáš úplně čerstvé vzpomínky – pokud budeš někdy potřebovat rychlé osvěžení, stáhni si tahák pro základy pandas a měj ho po ruce!

Upozorňujeme, že jde o reálná data z Twitteru, a proto vždy existuje riziko výskytu vulgárních nebo jinak nevhodných výrazů (v tomto cvičení i v dalších cvičeních pracujících s reálnými daty z Twitteru).

Pokyny

100 XP
  • Importuj pandas (nezapomeň, že podle konvence ho aliasujeme jako pd).
  • Zpracuj tweety z data_science_json pomocí flatten_tweets() a ulož je do proměnné tweets.
  • Vytvoř DataFrame z proměnné tweets pomocí pd.DataFrame().
  • Vypiš text prvních 5 tweetů.