Descoberta de dados
Nos exercícios de código, você vai usar a teoria que acabou de ver e aplicá-la a um novo conjunto de dados. Esse conjunto de dados é sobre clientes de um banco e será usado para prever se clientes vão dar calote em seus pagamentos de empréstimos.
Existem funções muito úteis no R para obter uma visão geral do conjunto de dados. Por enquanto, você vai olhar apenas para summary() e str().
Os pacotes necessários já foram carregados e o conjunto de dados defaultData já está disponível no seu ambiente de trabalho.
Este exercício faz parte do curso
Machine Learning for Marketing Analytics in R
Instruções do exercício
- Use
summary()estr()para explorar seus dados. - Também obtenha mais insights sobre a variável de interesse
PaymentDefaultplotando um gráfico de barras com os dois níveis.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Summary of data
___(defaultData)
# Look at data structure
___(defaultData)
# Analyze the balancedness of dependent variable
ggplot(___,aes(x = ___)) +
geom_histogram(stat = "count")