Histogramas

O conjunto de dados loan_data está carregado no seu ambiente. Você explorou variáveis categóricas usando a função CrossTable(). Agora você quer explorar variáveis contínuas para identificar possíveis outliers ou estruturas inesperadas nos dados.

Para isso, vamos experimentar a função hist() para entender a distribuição do número de empréstimos para diferentes clientes.

Este exercício faz parte do curso

Modelagem de Risco de Crédito em R

Ver curso

Instruções do exercício

Use hist() para criar um histograma com apenas um argumento: loan_data$loan_amnt. Atribua o resultado a um novo objeto chamado hist_1.
Use $breaks junto com o objeto hist_1 para obter mais informações sobre as quebras do histograma. Saber a localização das quebras é importante porque, se forem mal escolhidas, o histograma pode induzir ao erro.
Altere o número de quebras em hist_1 para 200 especificando o argumento breaks. Além disso, nomeie o eixo x como "Loan amount" usando o argumento xlab e dê o título "Histogram of the loan amount" usando o argumento main. Salve o resultado em hist_2. Por que os picos ocorrem onde ocorrem?

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create histogram of loan_amnt: hist_1


# Print locations of the breaks in hist_1


# Change number of breaks and add labels: hist_2
hist_2 <- hist(loan_data$loan_amnt, breaks = ___, xlab = "___", 
               main = "___")

Editar e executar o código