Observando variáveis categóricas
Lembre-se, do exercício anterior, que:
- Variáveis ordinais têm duas ou mais categorias que podem ser ranqueadas ou ordenadas
- Variáveis nominais têm duas ou mais categorias que não possuem uma ordem intrínseca
No seu conjunto de dados:
salaryé uma variável ordinaldepartmenté uma variável nominal
Neste exercício, você vai observar as variáveis categóricas encontradas no exercício anterior. Para isso, primeiro você vai importar a biblioteca pandas e ler o arquivo CSV chamado "turnover.csv". Em seguida, você vai imprimir os valores únicos dessas variáveis.
Este exercício faz parte do curso
HR Analytics: prevendo rotatividade de funcionários em Python
Instruções do exercício
- Importe
pandas(comopd) para ler os dados (isso já foi feito para você). - Leia o arquivo
"turnover.csv"e salve-o em um DataFrame chamadodata. - Imprima os valores únicos da coluna
"department". - Imprima os valores únicos da coluna
"salary".
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import pandas (as pd) to read the data
import pandas as pd
# Read "turnover.csv" file and save it in a DataFrame called data
data = pd.read_csv(____)
# Print the unique values of the "department" column
print(data.____.____())
# Print the unique values of the "salary" column
print(data.____.____())