IniziaInizia gratis

I balzi più grandi in un nome

In precedenza, hai aggiunto una colonna ratio per descrivere il rapporto tra la frequenza di un nome tra anni consecutivi, così da cogliere i cambiamenti nella popolarità di un nome. Ora esaminerai un sottoinsieme di quei dati, chiamato babynames_ratios_filtered, per approfondire i nomi che hanno registrato i balzi più grandi di popolarità in anni consecutivi.

babynames_ratios_filtered <- babynames_fraction %>%
                     arrange(name, year) %>%
                     group_by(name) %>%
                     mutate(ratio = fraction / lag(fraction)) %>%
                     filter(fraction >= 0.00001)

Questo esercizio fa parte del corso

Manipolazione dei dati con dplyr

Visualizza il corso

Istruzioni dell'esercizio

  • Per ciascun nome nei dati, conserva l’osservazione (l’anno) con il ratio più grande; nota che i dati sono già raggruppati per name.
  • Ordina la colonna ratio in ordine decrescente.
  • Restringi ulteriormente babynames_ratios_filtered filtrando la colonna fraction per mostrare solo risultati maggiori o uguali a 0.001.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

babynames_ratios_filtered %>%
  # Extract the largest ratio from each name 
  ___
  # Sort the ratio column in descending order 
  ___
  # Filter for fractions greater than or equal to 0.001
  ___
Modifica ed esegui il codice