1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Analýza dat ze sociálních sítí v Pythonu

Connected

cvičení

Porovnání #python a #rstats

Teď, když máme funkci, která dokáže zjistit, zda se dané slovo vyskytuje v tweetu na více místech, můžeme ji použít pro více slov najednou a výsledky porovnat. Vraťme se k příkladu s datasetem hashtagů o datové vědě. Chceme zjistit, jak často se v něm vyskytuje #rstats ve srovnání s #python.

Dataset s hashtagy o datové vědě ds_tweets je už načtený.

Pokyny

100 XP
  • Pomocí funkce check_word_in_tweet() najdi všechny výskyty #python v textových polích datasetu ds_tweets.
  • Totéž proveď pro #rstats.
  • Vytiskni podíl tweetů zmiňujících #python tak, že sečteš hodnoty v python pomocí np.sum() a vydělíš je hodnotou ds_tweets.shape[0].
  • Totéž proveď pro rstats.