IniziaInizia gratis

Esplorazione dei dati

Negli esercizi di coding userai la teoria appena vista applicandola a un nuovo insieme di dati. Questo insieme di dati riguarda clienti di banca e verrà usato per prevedere se i clienti andranno in default sui pagamenti del loro prestito.

In R ci sono funzioni molto utili per ottenere una panoramica dell'insieme di dati con cui stai lavorando. Per ora userai solo summary() e str().

I pacchetti necessari sono già caricati e l'insieme di dati defaultData è già presente nel tuo ambiente di lavoro.

Questo esercizio fa parte del corso

Machine Learning per il Marketing Analytics in R

Visualizza il corso

Istruzioni dell'esercizio

  • Usa summary() e str() per esaminare i tuoi dati.
  • Assicurati anche di ottenere più informazioni sulla variabile di interesse PaymentDefault tracciando un grafico a barre dei due livelli.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Summary of data
___(defaultData)

# Look at data structure
___(defaultData)

# Analyze the balancedness of dependent variable
ggplot(___,aes(x = ___)) +
  geom_histogram(stat = "count") 
Modifica ed esegui il codice