Histogramas
O conjunto de dados loan_data está carregado no seu ambiente. Você explorou variáveis categóricas usando a função CrossTable(). Agora você quer explorar variáveis contínuas para identificar possíveis outliers ou estruturas inesperadas nos dados.
Para isso, vamos experimentar a função hist() para entender a distribuição do número de empréstimos para diferentes clientes.
Este exercício faz parte do curso
Modelagem de Risco de Crédito em R
Instruções do exercício
- Use hist() para criar um histograma com apenas um argumento:
loan_data$loan_amnt. Atribua o resultado a um novo objeto chamadohist_1. - Use
$breaksjunto com o objetohist_1para obter mais informações sobre as quebras do histograma. Saber a localização das quebras é importante porque, se forem mal escolhidas, o histograma pode induzir ao erro. - Altere o número de quebras em
hist_1para 200 especificando o argumentobreaks. Além disso, nomeie o eixo x como"Loan amount"usando o argumentoxlabe dê o título"Histogram of the loan amount"usando o argumentomain. Salve o resultado emhist_2. Por que os picos ocorrem onde ocorrem?
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create histogram of loan_amnt: hist_1
# Print locations of the breaks in hist_1
# Change number of breaks and add labels: hist_2
hist_2 <- hist(loan_data$loan_amnt, breaks = ___, xlab = "___",
main = "___")