IniziaInizia gratis

Esaminare il numero di livelli

dplyr include altre due funzioni utili per esplorare un insieme di dati. La prima è slice_max(var, n = x), che restituisce le prime x righe di un insieme di dati in base al valore di var. L’altra è pull(), che permette di estrarre una colonna rimuovendone il nome, lasciando solo i valori della colonna.

Per esempio, se volessimo ottenere, come insieme di valori, i due valori di mpg più alti dal classico insieme di dati mtcars, scriveremmo:

mtcars %>%
  slice_max(mpg, n = 2) %>%
  pull(mpg)

Questo ci restituisce:

[1] 32.4 33.9

Questo esercizio fa parte del corso

Dati categoriali nel Tidyverse

Visualizza il corso

Istruzioni dell'esercizio

  • Usa slice_max() per stampare le 3 righe con il numero più alto di livelli del fattore.
  • Filtrando per la variabile CurrentJobTitleSelect, usa pull per ottenere quanti livelli ha.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Select the 3 rows with the highest number of levels
number_of_levels %>%
    ___(num_levels, n = 3)
    
number_of_levels %>%
	# Filter for where the column called variable equals CurrentJobTitleSelect
    filter(___) %>%
	# Pull num_levels
    ___
Modifica ed esegui il codice