Esaminare il numero di livelli
dplyr include altre due funzioni utili per esplorare un insieme di dati. La prima è slice_max(var, n = x), che restituisce le prime x righe di un insieme di dati in base al valore di var. L’altra è pull(), che permette di estrarre una colonna rimuovendone il nome, lasciando solo i valori della colonna.
Per esempio, se volessimo ottenere, come insieme di valori, i due valori di mpg più alti dal classico insieme di dati mtcars, scriveremmo:
mtcars %>%
slice_max(mpg, n = 2) %>%
pull(mpg)
Questo ci restituisce:
[1] 32.4 33.9
Questo esercizio fa parte del corso
Dati categoriali nel Tidyverse
Istruzioni dell'esercizio
- Usa
slice_max()per stampare le 3 righe con il numero più alto di livelli del fattore. - Filtrando per la variabile
CurrentJobTitleSelect, usapullper ottenere quanti livelli ha.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Select the 3 rows with the highest number of levels
number_of_levels %>%
___(num_levels, n = 3)
number_of_levels %>%
# Filter for where the column called variable equals CurrentJobTitleSelect
filter(___) %>%
# Pull num_levels
___