1. Learn
  2. /
  3. Курси
  4. /
  5. Опрацювання даних у pandas

Connected

вправа

Вибірка рядків (subsetting)

Велика частина роботи з даними полягає в тому, щоб знаходити цікаві фрагменти вашого набору даних. Один із найпростіших прийомів — вибрати підмножину рядків, які відповідають певним критеріям. Це ще називають «фільтруванням рядків» або «вибором рядків».

Є багато способів обрати підмножину датафрейму. Можливо, найпоширеніший — використати оператори порівняння, щоб отримати True або False для кожного рядка, а потім передати це всередині квадратних дужок.

dogs[dogs["height_cm"] > 60]
dogs[dogs["color"] == "tan"]

Можна фільтрувати за кількома умовами одночасно, використовуючи побітовий оператор «і» — &.

dogs[(dogs["height_cm"] > 60) & (dogs["color"] == "tan")]

homelessness доступний, а pandas імпортовано як pd.

Інструкції 1/3

undefined XP
  • 1

    Відфільтруйте homelessness для випадків, коли кількість individuals більша за десять тисяч, і збережіть у ind_gt_10k. Перегляньте надрукований результат.

  • 2

    Відфільтруйте homelessness для випадків, коли переписне region США дорівнює "Mountain", і збережіть у mountain_reg. Перегляньте надрукований результат.

  • 3

    Відфільтруйте homelessness для випадків, коли кількість family_members менша за одну тисячу та region дорівнює "Pacific", і збережіть у fam_lt_1k_pac. Перегляньте надрукований результат.