Identificando variáveis categóricas
Variáveis categóricas são variáveis que assumem um número limitado de valores que descrevem uma categoria. Elas podem ser de dois tipos:
- Ordinal – variáveis com duas ou mais categorias que podem ser classificadas ou ordenadas (ex.: “baixo”, “médio”, “alto”)
- Nominal – variáveis com duas ou mais categorias que não têm uma ordem intrínseca (ex.: “homens”, “mulheres”)
Neste exercício, você vai encontrar as variáveis categóricas no conjunto de dados. Para isso, primeiro você vai importar a biblioteca pandas e ler o arquivo CSV chamado "turnover.csv". Depois, ao visualizar as 5 primeiras linhas e perceber (visualmente) que há valores não numéricos no DataFrame, você vai obter informações sobre os tipos de variáveis disponíveis no conjunto de dados.
Este exercício faz parte do curso
HR Analytics: prevendo rotatividade de funcionários em Python
Instruções do exercício
- Importe
pandas(comopd) para ler os dados. - Leia o arquivo
"turnover.csv"e salve-o em um DataFrame chamadodata. - Dê uma olhada rápida nas 5 primeiras linhas dos dados.
- Obtenha algumas
info()-rmações sobre os tipos de variáveis nos dados.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import pandas (as pd) to read the data
import ____ as pd
# Read "turnover.csv" and save it in a DataFrame called data
data = pd.____("turnover.csv")
# Take a quick look to the first 5 rows of data
print(data.____())
# Get some information on the types of variables in data
data.____()