ComeçarComece de graça

Examinando o número de níveis

dplyr tem outras duas funções que podem ajudar na exploração de um conjunto de dados. A primeira é slice_max(var, n = x), que retorna as primeiras x linhas de um conjunto de dados com base no valor de var. A outra é pull(), que permite extrair uma coluna e remover o nome, deixando apenas o(s) valor(es) da coluna.

Por exemplo, se quisermos obter, como um conjunto de valores, os dois maiores valores de mpg do clássico conjunto de dados mtcars, escreveríamos:

mtcars %>%
  slice_max(mpg, n = 2) %>%
  pull(mpg)

Isso retorna:

[1] 32.4 33.9

Este exercício faz parte do curso

Dados Categóricos no Tidyverse

Ver curso

Instruções do exercício

  • Use slice_max() para imprimir as 3 linhas com o maior número de níveis de fator.
  • Filtrando pela variável CurrentJobTitleSelect, use pull para obter o número de níveis que ela tem.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Select the 3 rows with the highest number of levels
number_of_levels %>%
    ___(num_levels, n = 3)
    
number_of_levels %>%
	# Filter for where the column called variable equals CurrentJobTitleSelect
    filter(___) %>%
	# Pull num_levels
    ___
Editar e executar o código