Esplorazione dei dati
Negli esercizi di coding userai la teoria appena vista applicandola a un nuovo insieme di dati. Questo insieme di dati riguarda clienti di banca e verrà usato per prevedere se i clienti andranno in default sui pagamenti del loro prestito.
In R ci sono funzioni molto utili per ottenere una panoramica dell'insieme di dati con cui stai lavorando. Per ora userai solo summary() e str().
I pacchetti necessari sono già caricati e l'insieme di dati defaultData è già presente nel tuo ambiente di lavoro.
Questo esercizio fa parte del corso
Machine Learning per il Marketing Analytics in R
Istruzioni dell'esercizio
- Usa
summary()estr()per esaminare i tuoi dati. - Assicurati anche di ottenere più informazioni sulla variabile di interesse
PaymentDefaulttracciando un grafico a barre dei due livelli.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Summary of data
___(defaultData)
# Look at data structure
___(defaultData)
# Analyze the balancedness of dependent variable
ggplot(___,aes(x = ___)) +
geom_histogram(stat = "count")