Raggruppare le categorie
Un problema segnalato dagli utenti di un sito locale per l’adozione di cani è che ci sono troppe opzioni. Esaminando le diverse tipologie di cani, si perdono nella quantità eccessiva di scelta. Per semplificare alcuni dati, passerai in rassegna ogni colonna e raggrupperai i dati quando opportuno. Per preservare i dati originali, creerai nuove colonne aggiornate nel dataset dogs. Inizierai con la colonna coat. La tabella delle frequenze è la seguente:
short 1969
medium 565
wirehaired 220
long 180
medium-long 3
Questo esercizio fa parte del corso
Lavorare con i dati categorici in Python
Istruzioni dell'esercizio
- Crea un dizionario chiamato
update_coatsper mappare siawirehairedsiamedium-longamedium. - Raggruppa le categorie indicate in questo nuovo dizionario e salva il risultato in una nuova colonna,
coat_collapsed. - Converti questa nuova colonna in una Series categorica.
- Stampa la tabella delle frequenze di questa nuova Series.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create the update_coats dictionary
____
# Create a new column, coat_collapsed
dogs["coat_collapsed"] = ____
# Convert the column to categorical
____
# Print the frequency table
print(____)