Define valores personalizados de verdadero/falso
En columnas booleanas, pandas reconoce automáticamente ciertos valores, como "TRUE" y 1, como True, y otros, como "FALSE" y 0, como False. Algunos conjuntos de datos, como datos de encuestas, pueden usar valores no reconocidos, como "Yes" y "No".
Para practicar, algunas columnas booleanas en la New Developer Survey se han codificado de este modo. Te asegurarás de que se interpreten correctamente con la ayuda de los argumentos true_values y false_values.
pandas está cargado como pd. Puedes asumir que las columnas con las que trabajas no tienen valores faltantes.
Este ejercicio forma parte del curso
Ingesta de datos eficiente con pandas
Instrucciones del ejercicio
- Carga el archivo de Excel, especificando
"Yes"como valor verdadero y"No"como valor falso.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Load file with Yes as a True value and No as a False value
survey_subset = pd.read_excel("fcc_survey_yn_data.xlsx",
dtype={"HasDebt": bool,
"AttendedBootCampYesNo": bool},
____,
____)
# View the data
print(survey_subset.head())