Os maiores saltos em um nome
Anteriormente, você adicionou uma coluna ratio
para descrever a proporção da frequência de um nome de bebê entre anos consecutivos para descrever as mudanças na popularidade de um nome. Agora, você analisará um subconjunto desses dados, chamado babynames_ratios_filtered
, para saber mais sobre os nomes que tiveram os maiores saltos de popularidade em anos consecutivos.
babynames_ratios_filtered <- babynames_fraction %>%
arrange(name, year) %>%
group_by(name) %>%
mutate(ratio = fraction / lag(fraction)) %>%
filter(fraction >= 0.00001)
Este exercício faz parte do curso
Manipulação de dados com o dplyr
Instruções de exercício
- De cada nome nos dados, mantenha a observação (o ano) com o maior
ratio
; observe que os dados já estão agrupados porname
. - Classifique a coluna
ratio
em ordem decrescente. - Para filtrar ainda mais os dados de
babynames_ratios_filtered
, filtre a colunafraction
para exibir apenas os resultados maiores ou iguais a0.001
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
babynames_ratios_filtered %>%
# Extract the largest ratio from each name
___
# Sort the ratio column in descending order
___
# Filter for fractions greater than or equal to 0.001
___