1. 学ぶ
  2. /
  3. コース
  4. /
  5. End-to-End Machine Learning

Connected

演習

データセットのクリーニング

心疾患データセットのような実データは、重複や欠損値を含むなど、しばしば汚れています。この演習では、本章で学んだスキルを使って心疾患データセットのデータクリーニングを行います。データセットはすでに読み込まれています。EDA の結果に基づき、一般的なクリーニング処理を特定し実行してください。具体的には、空の列を削除し、重複行をドロップし、心電図の指標に関わる restecg 列に対して欠損値の補完を行います。Pandas は pd としてインポート済みで、心疾患データセットは heart_disease_df という pandas の DataFrame に格納されています。

指示1 / 4

undefined XP
    1
    2
    3
    4
  • 空の "oldpeak" 列を削除します。