IniziaInizia gratis

Estrazione delle mention

In ogni sotto-lista dell'insieme di dati dei tweet c’è un elemento chiamato "mentions_screen_name" (cioè gli handle di Twitter). Questo elemento contiene NULL se nel tweet non ci sono mention, oppure uno o più screen name menzionati nel tweet. Un modo per individuare un account popolare da una lista di tweet è capire quali utenti vengono menzionati più spesso in una specifica raccolta di tweet.

Per prima cosa estrarremo un vettore con tutte le mention e, una volta ottenuto questo nuovo vettore, conteremo quante volte ogni profilo è stato menzionato. Per farlo, costruiremo una nuova funzione composta, combinando table() (che conta quante volte ogni elemento compare nel vettore), sort(), e tail().

purrr è già stato caricato per te e rstudioconf è disponibile nel tuo ambiente.

Questo esercizio fa parte del corso

Programmazione funzionale intermedia con purrr

Visualizza il corso

Istruzioni dell'esercizio

  • Crea una funzione che sia la combinazione di as_vector(), compact() e flatten().

  • Crea una funzione che prenda due argomenti: list e what. Questa funzione eseguirà map( list, what ) e passerà il risultato a flatten_to_vector.

  • Crea six_most, una funzione che combini tail(), sort() e table().

  • Esegui extractor() su rstudioconf e passa il risultato a six_most().

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Combine as_vector(), compact(), and flatten()
flatten_to_vector <- ___(___, ___, ___)

# Complete the function
extractor <- function(list, what = "mentions_screen_name"){
  map( ___ , ___ ) %>%
    ___()
}

# Create six_most, with tail(), sort(), and table()
six_most <- ___(___, ___, ___)

# Run extractor() on rstudioconf
___(rstudioconf) %>% 
  ___()
Modifica ed esegui il codice