1. 学ぶ
  2. /
  3. コース
  4. /
  5. Anomaly Detection in Python

Connected

演習

5数要約を出力する

新しいデータの感触を素早くつかむ方法のひとつが5数要約です。これは分布について、最小値、25パーセンタイル、中央値、75パーセンタイル、最大値に加えて、平均と標準偏差を出力します。5数要約と、平均と最小値/最大値の差を見比べることで、その分布に外れ値が含まれていそうか大まかに判断できます。

この章の演習では、動画で紹介した手法を使って、米国のAirbnbリスティングの中で最も高価(または安価)な物件の価格を検出していきます。データセットはpandasのDataFrameとして airbnb_df に読み込まれています。

指示

100 XP
  • US Airbnb Listingsデータから price 列を取り出し、prices に格納します。
  • prices の分布の5数要約を出力します。