1. Nauka
  2. /
  3. Kursy
  4. /
  5. Analiza danych z mediów społecznościowych w Pythonie

Connected

ćwiczenie

Elementy tweeta i spłaszczanie struktury

W strukturze JSON tweeta znajduje się wiele pól zawierających dane tekstowe. W typowym tweecie są to: treść tweeta, opis użytkownika oraz jego lokalizacja. W tweetach dłuższych niż 140 znaków pojawia się zagnieżdżony JSON z rozszerzonym tweetem. Z kolei w przypadku cytowanego tweeta mamy do czynienia zarówno z oryginalną treścią, jak i komentarzem.

W tym ćwiczeniu wyodrębnisz elementy tekstowe z jednego cytowanego tweeta, w którym oryginalny tweet ma więcej niż 140 znaków. Następnie – aby móc analizować tweety na większą skalę – spłaszczysz strukturę JSON tweeta do jednego poziomu. Dzięki temu będzie można przechowywać tweety w formacie DataFrame.

Zmienna quoted_tweet została już załadowana.

Instrukcje 1/2

undefined XP
    1
    2
  • Wyświetl treść tweeta (text).
  • Wyświetl treść cytowanego tweeta, czyli pole text w quoted_status.
  • Wyświetl rozszerzony tekst cytowanego tweeta (140+ znaków) – full_text w extended_tweet.
  • Wyświetl lokalizację użytkownika cytowanego tweeta.