ComeçarComece de graça

Descoberta de dados

Nos exercícios de código, você vai usar a teoria que acabou de ver e aplicá-la a um novo conjunto de dados. Esse conjunto de dados é sobre clientes de um banco e será usado para prever se clientes vão dar calote em seus pagamentos de empréstimos.

Existem funções muito úteis no R para obter uma visão geral do conjunto de dados. Por enquanto, você vai olhar apenas para summary() e str().

Os pacotes necessários já foram carregados e o conjunto de dados defaultData já está disponível no seu ambiente de trabalho.

Este exercício faz parte do curso

Machine Learning for Marketing Analytics in R

Ver curso

Instruções do exercício

  • Use summary() e str() para explorar seus dados.
  • Também obtenha mais insights sobre a variável de interesse PaymentDefault plotando um gráfico de barras com os dois níveis.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Summary of data
___(defaultData)

# Look at data structure
___(defaultData)

# Analyze the balancedness of dependent variable
ggplot(___,aes(x = ___)) +
  geom_histogram(stat = "count") 
Editar e executar o código