1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Streamlined Data Ingestion with pandas

Connected

cvičení

Nastavení Boolean sloupců

Některé sloupce v datových sadách je nejpřesnější modelovat jako Boolean hodnoty. pandas je ale standardně načítá jako floaty, protože automatické převedení na Boolean by mohlo mít nežádoucí efekty – například by NA hodnoty byly považovány za True.

Soubor fcc_survey_subset.xlsx obsahuje sloupec s ID ve formátu řetězce a několik sloupců True/False označujících finanční zátěž. Zjistíš, které sloupce mimo ID neobsahují žádné NA hodnoty, a tedy je lze nastavit jako Boolean, a pak read_excel() pomocí argumentu dtype řekneš, aby je tak načetla.

pandas je načtený jako pd.

Pokyny 1/2

undefined XP
    1
    2
  • Spočítej NA hodnoty v každém sloupci survey_data pomocí isna() a sum(). Všimni si, které sloupce kromě ID.x (pokud vůbec nějaké) mají nulový počet NA.