1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶDeep Learning入門

Connected

演習

分類データを理解する

ここからは、新しいデータセットを使って分類問題のモデリングを始めます。このデータにはタイタニック号の乗客に関する情報が含まれています。age や fare、乗船地などの特徴量を使って、生存者を予測します。このデータは「データサイエンス競技のチュートリアル」からのものです(https://www.kaggle.com/c/titanic)。特徴量の説明はこちらを参照してください。

データは pandas の DataFrame df にあらかじめ読み込まれています。

各変数の最大値と最小値を確認して、データの形式の誤りや破損がないかチェックするのは良い習慣です。タイタニック号の乗客の年齢の最大値はいくつでしたか?この質問には IPython シェルで .describe() メソッドを使って答えてください。

指示

50 XP

選択肢