IniziaInizia gratis

Istogrammi

L'insieme di dati loan_data è caricato nel tuo workspace. In precedenza hai esplorato le variabili categoriche usando la funzione CrossTable(). Ora vuoi analizzare le variabili continue per individuare potenziali valori anomali o strutture dei dati inattese.

Per farlo, sperimentiamo con la funzione hist() per capire la distribuzione del numero di prestiti per diversi clienti.

Questo esercizio fa parte del corso

Credit Risk Modeling in R

Visualizza il corso

Istruzioni dell'esercizio

  • Usa hist() per creare un istogramma con un solo argomento: loan_data$loan_amnt. Assegna il risultato a un nuovo oggetto chiamato hist_1.
  • Usa $breaks insieme all'oggetto hist_1 per ottenere più informazioni sugli intervalli (breaks) dell'istogramma. Conoscere la posizione dei breaks è importante perché, se scelti male, l'istogramma può risultare fuorviante.
  • Cambia il numero di breaks in hist_1 a 200 specificando l'argomento breaks. Inoltre, assegna all'asse x il nome "Loan amount" usando l'argomento xlab e il titolo "Histogram of the loan amount" usando l'argomento main. Salva il risultato in hist_2. Perché i picchi compaiono dove compaiono?

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Create histogram of loan_amnt: hist_1


# Print locations of the breaks in hist_1


# Change number of breaks and add labels: hist_2
hist_2 <- hist(loan_data$loan_amnt, breaks = ___, xlab = "___", 
               main = "___")
Modifica ed esegui il codice