1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Analýza dat ze sociálních sítí v Pythonu

Connected

cvičení

Hledání klíčových slov

Počítání výskytů klíčových slov je jedním z prvních způsobů, jak analyzovat textová data v tweetech. V této datové sadě spočítáš, kolikrát se konkrétní hashtagy objevují v kolekci tweetů o datové vědě. K tomu využiješ řetězcové metody objektu pandas Series.

pandas a numpy jsou importované jako pd a np. K dispozici máš také plně funkční flatten_tweets a data_science_json.

Pokyny

100 XP
  • Zpracuj tweety pomocí flatten_tweets() a výsledek ulož do flat_tweets.
  • Převeď tweety na DataFrame pomocí konstruktoru pandas DataFrame.
  • Najdi zmínky o #python ve sloupci 'text', bez ohledu na velikost písmen.
  • Vypiš podíl tweetů zmiňujících #python – sečti hodnoty v python pomocí np.sum() a vyděl celkovým počtem tweetů.