1. 学ぶ
  2. /
  3. コース
  4. /
  5. pandas で学ぶデータ操作

Connected

演習

欠損値を置き換える

欠損値への対処法の一つは、すべて同じ値で置き換える方法です。数値変数の場合は 0 に置き換えるのが一案で、ここでもそれを行います。ただし、欠損値を置き換えると、その欠損が何を意味するかについて前提を置くことになります。今回の例では、販売数が欠損しているのは「その週はその種類のアボカドが売れなかった」とみなします。

この演習では、ヒストグラムを使って、欠損値の置き換えが変数の分布にどのような影響を与えるかを確認します。複数の変数のヒストグラムは次のように同時に描画できます。

dogs[["height_cm", "weight_kg"]].hist()

pandas は pd、matplotlib.pyplot は plt としてインポート済みです。avocados_2016 データセットを利用します。

指示1 / 2

undefined XP
    1
    2
  • 欠損値を含む列名 "small_sold"、"large_sold"、"xl_sold" を要素に持つリスト cols_with_missing が用意されています。
  • それらの列のヒストグラムを作成します。
  • プロットを表示します。