Individuare le variabili categoriche
Le variabili categoriche sono variabili che assumono un numero limitato di valori che descrivono una categoria. Possono essere di due tipi:
- Ordinali – variabili con due o più categorie che possono essere classificate o ordinate (es. “basso”, “medio”, “alto”)
- Nominali – variabili con due o più categorie che non hanno un ordine intrinseco (es. “uomini”, “donne”)
In questo esercizio individuerai le variabili categoriche nell’insieme di dati. Per farlo, per prima cosa importerai la libreria pandas e leggerai il file CSV chiamato "turnover.csv". Poi, dopo aver visualizzato le prime 5 righe e aver notato (visivamente) che nel DataFrame ci sono valori non numerici, otterrai alcune informazioni sui tipi di variabili presenti nell’insieme di dati.
Questo esercizio fa parte del corso
HR Analytics: prevedere l'abbandono dei dipendenti in Python
Istruzioni dell'esercizio
- Importa
pandas(comepd) per leggere i dati. - Leggi il file
"turnover.csv"e salvalo in un DataFrame chiamatodata. - Dai un’occhiata veloce alle prime 5 righe dei dati.
- Ottieni qualche
info()-rmazione sui tipi di variabili nei dati.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import pandas (as pd) to read the data
import ____ as pd
# Read "turnover.csv" and save it in a DataFrame called data
data = pd.____("turnover.csv")
# Take a quick look to the first 5 rows of data
print(data.____())
# Get some information on the types of variables in data
data.____()