1. Lära sig
  2. /
  3. Courses
  4. /
  5. Manipulace s daty v pandas

Connected

exercise

Výběr řádků

Velká část datové vědy spočívá v tom, najít v datasetu ty části, které nás skutečně zajímají. Jednou z nejjednodušších technik je vybrat podmnožinu řádků splňujících určitá kritéria – tento postup se někdy označuje jako filtrování řádků nebo výběr řádků.

DataFrame lze filtrovat mnoha způsoby. Nejčastější přístup je použít relační operátory, které pro každý řádek vrátí hodnotu True nebo False, a tento výsledek předat do hranatých závorek.

dogs[dogs["height_cm"] > 60]
dogs[dogs["color"] == "tan"]

Pro filtrování podle více podmínek najednou použij operátor „bitový and", &.

dogs[(dogs["height_cm"] > 60) & (dogs["color"] == "tan")]

homelessness je k dispozici a pandas je načteno jako pd.

Instruktioner 1 / 3

undefined XP
  • 1

    Filtruj homelessness podle případů, kde počet individuals je větší než deset tisíc, a výsledek ulož do ind_gt_10k. Prohlédni si vytištěný výsledek.

  • 2

    Filtruj homelessness podle případů, kde region dle sčítání lidu USA odpovídá hodnotě "Mountain", a výsledek ulož do mountain_reg. Prohlédni si vytištěný výsledek.

  • 3

    Filtruj homelessness podle případů, kde počet family_members je menší než tisíc a zároveň region je "Pacific", a výsledek ulož do fam_lt_1k_pac. Prohlédni si vytištěný výsledek.