IniziaInizia gratis

Abbiamo un vincitore!

In questo esercizio identificheremo una metrica importante: chi è l’utente che ha pubblicato il tweet con il maggior numero di retweet?

Questo tipo di informazione è utile quando fai analisi dei social media: ti dirà qual è il tweet più “famoso” del tuo insieme di dati. In futuro può aiutarti a capire quali sono i temi e gli utenti chiave per un determinato argomento/hashtag.

Useremo purrr per estrarre il tweet con più retweet dal nostro corpus e vedere chi è l’utente dietro a questo tweet. Poiché vogliamo eseguire l’analisi solo sui tweet originali, ti forniamo la lista non_rt, creata in un esercizio precedente.

Questo esercizio fa parte del corso

Programmazione funzionale intermedia con purrr

Visualizza il corso

Istruzioni dell'esercizio

  • Estrai tutti gli elementi "retweet_count" con la variante map_*() appropriata. Passali a max().

  • Precompila un map_at(), con .at impostato a "retweet_count" e .f un mapper che testa l’uguaglianza a max_rt.

  • Applica questa nuova funzione a non_rt, tieni solo "retweet_count" e appiattisci il risultato.

  • Stampa in console $screen_name e $text del risultato.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Get the max() of "retweet_count" 
max_rt <- ___(non_rt, ___) %>% 
  ___()

# Prefill map_at() with a mapper testing if .x equal max_rt
max_rt_calc <- ___(___, .at = "retweet_count", .f := ~ ___ )

res <- non_rt %>%
  # Call max_rt_calc() on each element
  ___(___) %>% 
  # Keep elements where retweet_count is non-zero
  ___("___") %>% 
  # Flatten it
  ___()

# Print the "screen_name" and "text" of the result
res$screen_name
res$text
Modifica ed esegui il codice