1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶデータクリーニング

Connected

演習

一貫性を見つける

この演習およびこの章を通して、航空会社の顧客によるサンフランシスコ空港の調査回答を含む airlines DataFrame を扱います。

この DataFrame には、航空会社名、行き先、待ち時間といったフライトのメタデータに加えて、清潔さ、安全性、満足度に関する主要な質問への回答が含まれています。さらに、調査列に対する正しい可能な値をすべてまとめた categories という DataFrame も用意されています。

この演習では、これら2つの DataFrame を使って、値が不一致な調査回答を見つけて削除します。動画の演習で見たように、この操作は両 DataFrame に対する外部結合と内部結合を行うことに相当します。pandas パッケージは pd としてインポート済みで、airlines と categories の各 DataFrame は環境に読み込まれています。

指示1 / 4

undefined XP
    1
    2
    3
    4
  • categories DataFrame を表示し、調査列に対して取りうる正しいカテゴリをすべて確認します。
  • .unique() メソッドを使って、airlines の調査列に含まれるユニークな値を表示します。