Boolean-kolommen instellen
Gegevenssets kunnen kolommen bevatten die het best als Boolean-waarden worden gemodelleerd. pandas laadt deze echter meestal standaard als floats, omdat standaard Booleans ongewenste effecten kan hebben, zoals NA-waarden omzetten naar True.
fcc_survey_subset.xlsx bevat een string-ID-kolom en meerdere True/False-kolommen die financiële stressfactoren aangeven. Je beoordeelt welke niet-ID-kolommen geen NA-waarden hebben en daarom als Boolean kunnen worden ingesteld, en geeft read_excel() vervolgens via het argument dtype opdracht om ze zo te laden.
pandas is geladen als pd.
Deze oefening maakt deel uit van de cursus
Gestroomlijnde data-inname met pandas
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load the data
survey_data = pd.read_excel("fcc_survey_subset.xlsx")
# Count NA values in each column
print(survey_data.____)