Definir valores personalizados de verdadeiro/falso
Em colunas Booleanas, o pandas reconhece automaticamente certos valores, como "TRUE" e 1, como True, e outros, como "FALSE" e 0, como False. Alguns conjuntos de dados, como dados de pesquisas, podem usar valores não reconhecidos, como "Yes" e "No".
Para fins de prática, algumas colunas Booleanas na New Developer Survey foram codificadas desse jeito. Você vai garantir que elas sejam interpretadas corretamente usando os argumentos true_values e false_values.
O pandas está carregado como pd. Você pode assumir que as colunas com que está trabalhando não têm valores ausentes.
Este exercício faz parte do curso
Ingestão de dados simplificada com pandas
Instruções do exercício
- Carregue o arquivo do Excel, especificando
"Yes"como um valor verdadeiro e"No"como um valor falso.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Load file with Yes as a True value and No as a False value
survey_subset = pd.read_excel("fcc_survey_yn_data.xlsx",
dtype={"HasDebt": bool,
"AttendedBootCampYesNo": bool},
____,
____)
# View the data
print(survey_subset.head())