1. 学ぶ
  2. /
  3. コース
  4. /
  5. pandas で学ぶデータ操作

Connected

演習

行の抽出(サブセット)

データサイエンスでは、データセットの中で「どの部分が重要か」を見つけることが大きな役割を占めます。その基本的な方法のひとつが、条件に合う行だけを取り出すことです。これは「行のフィルタリング」や「行の選択」と呼ばれます。

DataFrame をサブセット化する方法は多数ありますが、最も一般的なのは、各行に対して True/False を返す関係演算子を使い、その結果を角かっこ内に渡すやり方です。

dogs[dogs["height_cm"] > 60]
dogs[dogs["color"] == "tan"]

複数の条件を同時に指定するには、ビット演算子の「AND」である & を使います。

dogs[(dogs["height_cm"] > 60) & (dogs["color"] == "tan")]

homelessness は利用可能で、pandas は pd として読み込まれています。

指示1 / 3

undefined XP
  • 1

    individuals の数が 1 万より大きい行で homelessness をフィルタし、ind_gt_10k に代入してください。印字された結果を確認しましょう。

  • 2

    米国国勢調査の region が "Mountain" の行で homelessness をフィルタし、mountain_reg に代入してください。印字された結果を確認しましょう。

  • 3

    family_members の数が 1,000 未満かつ region が "Pacific" の行で homelessness をフィルタし、fam_lt_1k_pac に代入してください。印字された結果を確認しましょう。