IniziaInizia gratis

Analisi di un sondaggio

Una variabile categorica è una variabile che può assumere un numero limitato di valori possibili.

Alleniamoci a gestire dati categorici prima del colloquio usando il dataset survey del pacchetto MASS. Il dataset contiene le risposte di studenti di statistica a diverse domande.

Una delle domande riguarda la frequenza con cui gli studenti fanno esercizio fisico. Le risposte a questa domanda sono nella colonna Exer. Le risposte disponibili erano:

  • "None"
  • "Some", e
  • "Freq" (frequentemente).

Nota che queste risposte possono essere messe in ordine.

Ricorda che tapply() applica una funzione a ciascun gruppo di valori all'interno delle categorie.

Per esempio,

tapply(survey$Age, survey$Sex, median)

calcola l'età mediana suddivisa per sesso.

Il dataset è stato precaricato ed è memorizzato nella variabile survey.

Questo esercizio fa parte del corso

Esercitarsi con le domande di statistica per i colloqui in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Return the structure of Exer
str(___)

# Create the ordered factor 
survey$Exer_ordered <- ___(survey$Exer, ___ = c("None", ___, ___), ordered = ___)

# Return the structure of Exer_ordered
___(___)
Modifica ed esegui il codice