ComeçarComece de graça

Identificando variáveis categóricas

Variáveis categóricas são variáveis que assumem um número limitado de valores que descrevem uma categoria. Elas podem ser de dois tipos:

  • Ordinal – variáveis com duas ou mais categorias que podem ser classificadas ou ordenadas (ex.: “baixo”, “médio”, “alto”)
  • Nominal – variáveis com duas ou mais categorias que não têm uma ordem intrínseca (ex.: “homens”, “mulheres”)

Neste exercício, você vai encontrar as variáveis categóricas no conjunto de dados. Para isso, primeiro você vai importar a biblioteca pandas e ler o arquivo CSV chamado "turnover.csv". Depois, ao visualizar as 5 primeiras linhas e perceber (visualmente) que há valores não numéricos no DataFrame, você vai obter informações sobre os tipos de variáveis disponíveis no conjunto de dados.

Este exercício faz parte do curso

HR Analytics: prevendo rotatividade de funcionários em Python

Ver curso

Instruções do exercício

  • Importe pandas (como pd) para ler os dados.
  • Leia o arquivo "turnover.csv" e salve-o em um DataFrame chamado data.
  • Dê uma olhada rápida nas 5 primeiras linhas dos dados.
  • Obtenha algumas info()-rmações sobre os tipos de variáveis nos dados.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import pandas (as pd) to read the data
import ____ as pd

# Read "turnover.csv" and save it in a DataFrame called data
data = pd.____("turnover.csv")

# Take a quick look to the first 5 rows of data
print(data.____())

# Get some information on the types of variables in data
data.____()
Editar e executar o código