Définir des valeurs vrai/faux personnalisées
Dans les colonnes booléennes, pandas reconnaît automatiquement certaines valeurs, comme "TRUE" et 1, comme True, et d’autres, comme "FALSE" et 0, comme False. Certains jeux de données, par exemple des enquêtes, utilisent des valeurs non reconnues, telles que "Yes" et "No".
Pour s’exercer, certaines colonnes booléennes du New Developer Survey ont été codées de cette façon. Vous allez vous assurer qu’elles sont correctement interprétées à l’aide des arguments true_values et false_values.
pandas est importé sous le nom pd. Vous pouvez supposer que les colonnes sur lesquelles vous travaillez ne contiennent pas de valeurs manquantes.
Cet exercice fait partie du cours
Ingestion de données simplifiée avec pandas
Instructions
- Chargez le fichier Excel, en indiquant
"Yes"comme valeur vraie et"No"comme valeur fausse.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Load file with Yes as a True value and No as a False value
survey_subset = pd.read_excel("fcc_survey_yn_data.xlsx",
dtype={"HasDebt": bool,
"AttendedBootCampYesNo": bool},
____,
____)
# View the data
print(survey_subset.head())