1. Nauka
  2. /
  3. Kursy
  4. /
  5. Analiza danych z mediów społecznościowych w Pythonie

Connected

ćwiczenie

Wyszukiwanie słów kluczowych

Zliczanie znanych słów kluczowych to jeden z pierwszych sposobów analizowania danych tekstowych w zbiorze tweetów. W tym ćwiczeniu sprawdzisz, ile razy określone hashtagi pojawiają się w kolekcji tweetów na temat data science. Wykorzystasz do tego metody stringowe dostępne w obiekcie pandas Series.

pandas i numpy zostały zaimportowane jako pd i np. Rozbudowana wersja funkcji flatten_tweets oraz obiekt data_science_json zostały już załadowane.

Instrukcje

100 XP
  • Spłaszcz tweety za pomocą flatten_tweets() i zapisz wynik w zmiennej flat_tweets.
  • Przekształć tweety w DataFrame, korzystając z konstruktora DataFrame biblioteki pandas.
  • Znajdź wzmianki o #python w kolumnie 'text', ignorując wielkość liter.
  • Wydrukuj proporcję tweetów wspominających #python, sumując wartości python za pomocą np.sum() i dzieląc przez łączną liczbę tweetów.