Abbiamo un vincitore!
In questo esercizio identificheremo una metrica importante: chi è l’utente che ha pubblicato il tweet con il maggior numero di retweet?
Questo tipo di informazione è utile quando fai analisi dei social media: ti dirà qual è il tweet più “famoso” del tuo insieme di dati. In futuro può aiutarti a capire quali sono i temi e gli utenti chiave per un determinato argomento/hashtag.
Useremo purrr per estrarre il tweet con più retweet dal nostro corpus e vedere chi è l’utente dietro a questo tweet. Poiché vogliamo eseguire l’analisi solo sui tweet originali, ti forniamo la lista non_rt, creata in un esercizio precedente.
Questo esercizio fa parte del corso
Programmazione funzionale intermedia con purrr
Istruzioni dell'esercizio
Estrai tutti gli elementi
"retweet_count"con la variantemap_*()appropriata. Passali amax().Precompila un
map_at(), con.atimpostato a"retweet_count"e.fun mapper che testa l’uguaglianza amax_rt.Applica questa nuova funzione a
non_rt, tieni solo"retweet_count"e appiattisci il risultato.Stampa in console
$screen_namee$textdel risultato.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Get the max() of "retweet_count"
max_rt <- ___(non_rt, ___) %>%
___()
# Prefill map_at() with a mapper testing if .x equal max_rt
max_rt_calc <- ___(___, .at = "retweet_count", .f := ~ ___ )
res <- non_rt %>%
# Call max_rt_calc() on each element
___(___) %>%
# Keep elements where retweet_count is non-zero
___("___") %>%
# Flatten it
___()
# Print the "screen_name" and "text" of the result
res$screen_name
res$text