Comece agoraComece grátis

Identificando variáveis categóricas

Variáveis categóricas são variáveis que assumem um número limitado de valores que descrevem uma categoria. Elas podem ser de dois tipos:

  • Ordinal – variáveis com duas ou mais categorias que podem ser classificadas ou ordenadas (ex.: “baixo”, “médio”, “alto”)
  • Nominal – variáveis com duas ou mais categorias que não têm uma ordem intrínseca (ex.: “homens”, “mulheres”)

Neste exercício, você vai encontrar as variáveis categóricas no conjunto de dados. Para isso, primeiro você vai importar a biblioteca pandas e ler o arquivo CSV chamado "turnover.csv". Depois, ao visualizar as 5 primeiras linhas e perceber (visualmente) que há valores não numéricos no DataFrame, você vai obter informações sobre os tipos de variáveis disponíveis no conjunto de dados.

Este exercicio faz parte do curso

HR Analytics: prevendo rotatividade de funcionários em Python

Ver curso

Instruções do exercicio

  • Importe pandas (como pd) para ler os dados.
  • Leia o arquivo "turnover.csv" e salve-o em um DataFrame chamado data.
  • Dê uma olhada rápida nas 5 primeiras linhas dos dados.
  • Obtenha algumas info()-rmações sobre os tipos de variáveis nos dados.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Import pandas (as pd) to read the data
import ____ as pd

# Read "turnover.csv" and save it in a DataFrame called data
data = pd.____("turnover.csv")

# Take a quick look to the first 5 rows of data
print(data.____())

# Get some information on the types of variables in data
data.____()
Editar e Executar Código