行のサブセット化

データサイエンスの重要な作業のひとつは、データセットの中から興味深い部分を見つけることです。最もシンプルな方法は、いくつかの条件に一致する行のサブセットを見つけることです。これは行のフィルタリングや行の選択と呼ばれることもあります。

DataFrameをサブセット化する方法はたくさんありますが、おそらく最も一般的なのは、比較演算子を使って各行について True または False を返し、それを角カッコの中に渡す方法です。

dogs[dogs["height_cm"] > 60]
dogs[dogs["color"] == "tan"]

ビット単位のAND演算子 & を使うと、複数の条件で同時にフィルタリングできます。

dogs[(dogs["height_cm"] > 60) & (dogs["color"] == "tan")]

homelessness はすでに用意されており、pandas は pd として読み込まれています。

この演習はコースの一部です

pandas によるデータ操作

このサンプルコードを完成させて、この演習に挑戦してみましょう。

# Filter for rows where individuals is greater than 10000
ind_gt_10k = ____

# See the result
print(ind_gt_10k)