IniziaInizia gratis

Calcola le combinazioni possibili

Il data frame healthcare_cat_df contiene variabili categoriali su dipendenti di un'azienda sanitaria e indica se hanno lasciato l'azienda o meno. Userai questo insieme di dati per determinare il numero di combinazioni dei valori delle caratteristiche presenti nel dataset.

Quando addestri un modello di Machine Learning, è importante che i dati contengano molte osservazioni per ciascuna combinazione. Quindi, il numero di combinazioni ti aiuta a definire un riferimento per il numero minimo di osservazioni da raccogliere per evitare bias nel modello.

Il pacchetto tidyverse è già stato caricato per te.

Questo esercizio fa parte del corso

Riduzione della dimensionalità in R

Visualizza il corso

Istruzioni dell'esercizio

  • Calcola il numero minimo di osservazioni necessario per rappresentare tutte le combinazioni dei valori delle caratteristiche in healthcare_cat_df.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Calculate the minimum number of value combinations
healthcare_cat_df %>% 
  ___(___(___(), ~ ___(unique(.)))) %>% 
  ___()
Modifica ed esegui il codice