Calcola le combinazioni possibili
Il data frame healthcare_cat_df contiene variabili categoriali su dipendenti di un'azienda sanitaria e indica se hanno lasciato l'azienda o meno. Userai questo insieme di dati per determinare il numero di combinazioni dei valori delle caratteristiche presenti nel dataset.
Quando addestri un modello di Machine Learning, è importante che i dati contengano molte osservazioni per ciascuna combinazione. Quindi, il numero di combinazioni ti aiuta a definire un riferimento per il numero minimo di osservazioni da raccogliere per evitare bias nel modello.
Il pacchetto tidyverse è già stato caricato per te.
Questo esercizio fa parte del corso
Riduzione della dimensionalità in R
Istruzioni dell'esercizio
- Calcola il numero minimo di osservazioni necessario per rappresentare tutte le combinazioni dei valori delle caratteristiche in
healthcare_cat_df.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Calculate the minimum number of value combinations
healthcare_cat_df %>%
___(___(___(), ~ ___(unique(.)))) %>%
___()