Examinando o número de níveis
dplyr tem outras duas funções que podem ajudar na exploração de um conjunto de dados. A primeira é slice_max(var, n = x), que retorna as primeiras x linhas de um conjunto de dados com base no valor de var. A outra é pull(), que permite extrair uma coluna e remover o nome, deixando apenas o(s) valor(es) da coluna.
Por exemplo, se quisermos obter, como um conjunto de valores, os dois maiores valores de mpg do clássico conjunto de dados mtcars, escreveríamos:
mtcars %>%
slice_max(mpg, n = 2) %>%
pull(mpg)
Isso retorna:
[1] 32.4 33.9
Este exercício faz parte do curso
Dados Categóricos no Tidyverse
Instruções do exercício
- Use
slice_max()para imprimir as 3 linhas com o maior número de níveis de fator. - Filtrando pela variável
CurrentJobTitleSelect, usepullpara obter o número de níveis que ela tem.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Select the 3 rows with the highest number of levels
number_of_levels %>%
___(num_levels, n = 3)
number_of_levels %>%
# Filter for where the column called variable equals CurrentJobTitleSelect
filter(___) %>%
# Pull num_levels
___