Analisi di un sondaggio
Una variabile categorica è una variabile che può assumere un numero limitato di valori possibili.
Alleniamoci a gestire dati categorici prima del colloquio usando il dataset survey del pacchetto MASS.
Il dataset contiene le risposte di studenti di statistica a diverse domande.
Una delle domande riguarda la frequenza con cui gli studenti fanno esercizio fisico. Le risposte a questa domanda sono nella colonna Exer.
Le risposte disponibili erano:
"None""Some", e"Freq"(frequentemente).
Nota che queste risposte possono essere messe in ordine.
Ricorda che tapply() applica una funzione a ciascun gruppo di valori all'interno delle categorie.
Per esempio,
tapply(survey$Age, survey$Sex, median)
calcola l'età mediana suddivisa per sesso.
Il dataset è stato precaricato ed è memorizzato nella variabile survey.
Questo esercizio fa parte del corso
Esercitarsi con le domande di statistica per i colloqui in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Return the structure of Exer
str(___)
# Create the ordered factor
survey$Exer_ordered <- ___(survey$Exer, ___ = c("None", ___, ___), ordered = ___)
# Return the structure of Exer_ordered
___(___)