Explorăm tweet-urile, runda 1

Îți amintești că ai lucrat ca analist de date pentru o agenție web în ultimele capitole ale acestui curs? Ei bine, ai făcut treabă bună și acum ai primit un nou proiect ;) În acest capitol, vei analiza un nou tip de date: output în format JSON.

Echipa de inginerie ți-a oferit rezultatul unei colecții de date care conține tweet-uri adunate în timpul conferinței RStudio Conf 2018. Deoarece acest set de date este în format JSON, l-ai citit ca o listă imbricată în R.

Mai întâi, vrei să faci o explorare de bază a acestui set de date, iar purrr te va ajuta în acest sens. Pachetul a fost deja încărcat, iar setul de date rstudioconf este disponibil în spațiul tău de lucru.

Notă: nu încerca să afișezi întregul set de date — este prea mare pentru a fi afișat în consola DataCamp.

Reține că acestea sunt date reale de pe Twitter și, prin urmare, există întotdeauna riscul ca acestea să conțină limbaj vulgar sau alt conținut ofensator (în acest exercițiu și în exercițiile următoare care folosesc de asemenea date reale de pe Twitter).

Afișează primul element al listei, pentru a obține o imagine de ansamblu asupra conținutului și structurii.
Deoarece vrei să te concentrezi pe tweet-urile originale (nu retweet-uri), creează o sublistă cu tweet-urile care nu sunt retweet-uri, folosind elementul logic "is_retweet" din fiecare sublistă.
Extrage elementul "favorite_count" din fiecare element al acestei noi subliste, folosind varianta map_* pentru numere întregi.
Calculează mediana rezultatului obținut anterior.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}exercițiu

Instrucțiuni

exercițiu