1. 学ぶ
  2. /
  3. コース
  4. /
  5. pandas によるデータ操作

Connected

演習

欠損値の置き換え

欠損値を処理するもう一つの方法は、すべての欠損値を同じ値で置き換えることです。数値変数の場合、値を0に置き換えるという選択肢があります。ここではこの方法を使います。ただし、欠損値を置き換えるときは、その欠損値が何を意味するのかについて仮定を置くことになります。今回は、販売数が欠損している場合、その週はそのアボカドの種類の販売がなかったものと仮定します。

この演習では、欠損値を置き換えることで変数の分布がどのように変わるかを、ヒストグラムを使って確認します。複数の変数のヒストグラムは、次のように一度に描画できます。

dogs[["height_cm", "weight_kg"]].hist()

pandas は pd としてインポートされており、matplotlib.pyplot は plt としてインポートされています。avocados_2016 データセットはすでに用意されています。

指示1 / 2

undefined XP
    1
    2
  • 欠損値を含む列名"small_sold"、"large_sold"、"xl_sold"が入ったリスト cols_with_missing が作成されています。
  • これらの列のヒストグラムを作成しましょう。
  • グラフを表示しましょう。