Istogrammi
L'insieme di dati loan_data è caricato nel tuo workspace. In precedenza hai esplorato le variabili categoriche usando la funzione CrossTable(). Ora vuoi analizzare le variabili continue per individuare potenziali valori anomali o strutture dei dati inattese.
Per farlo, sperimentiamo con la funzione hist() per capire la distribuzione del numero di prestiti per diversi clienti.
Questo esercizio fa parte del corso
Credit Risk Modeling in R
Istruzioni dell'esercizio
- Usa hist() per creare un istogramma con un solo argomento:
loan_data$loan_amnt. Assegna il risultato a un nuovo oggetto chiamatohist_1. - Usa
$breaksinsieme all'oggettohist_1per ottenere più informazioni sugli intervalli (breaks) dell'istogramma. Conoscere la posizione dei breaks è importante perché, se scelti male, l'istogramma può risultare fuorviante. - Cambia il numero di breaks in
hist_1a 200 specificando l'argomentobreaks. Inoltre, assegna all'asse x il nome"Loan amount"usando l'argomentoxlabe il titolo"Histogram of the loan amount"usando l'argomentomain. Salva il risultato inhist_2. Perché i picchi compaiono dove compaiono?
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create histogram of loan_amnt: hist_1
# Print locations of the breaks in hist_1
# Change number of breaks and add labels: hist_2
hist_2 <- hist(loan_data$loan_amnt, breaks = ___, xlab = "___",
main = "___")