IniziaInizia gratis

Individuare le variabili categoriche

Le variabili categoriche sono variabili che assumono un numero limitato di valori che descrivono una categoria. Possono essere di due tipi:

  • Ordinali – variabili con due o più categorie che possono essere classificate o ordinate (es. “basso”, “medio”, “alto”)
  • Nominali – variabili con due o più categorie che non hanno un ordine intrinseco (es. “uomini”, “donne”)

In questo esercizio individuerai le variabili categoriche nell’insieme di dati. Per farlo, per prima cosa importerai la libreria pandas e leggerai il file CSV chiamato "turnover.csv". Poi, dopo aver visualizzato le prime 5 righe e aver notato (visivamente) che nel DataFrame ci sono valori non numerici, otterrai alcune informazioni sui tipi di variabili presenti nell’insieme di dati.

Questo esercizio fa parte del corso

HR Analytics: prevedere l'abbandono dei dipendenti in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Importa pandas (come pd) per leggere i dati.
  • Leggi il file "turnover.csv" e salvalo in un DataFrame chiamato data.
  • Dai un’occhiata veloce alle prime 5 righe dei dati.
  • Ottieni qualche info()-rmazione sui tipi di variabili nei dati.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Import pandas (as pd) to read the data
import ____ as pd

# Read "turnover.csv" and save it in a DataFrame called data
data = pd.____("turnover.csv")

# Take a quick look to the first 5 rows of data
print(data.____())

# Get some information on the types of variables in data
data.____()
Modifica ed esegui il codice