1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Pythonで挑むKaggleコンペティション

Connected

Bài tập

EDA の基本統計

スライドで紹介したとおり、New York City のタクシー運賃予測データを使います。まずはデータの基本的な統計量を確認しましょう。その後、いくつかの依存関係を可視化して、それに基づいて仮説を立てていきます。

train と test の各 DataFrame は、すでにワークスペースに用意されています。

Hướng dẫn 1/2

undefined XP
    1
    2
  • train データと test データの shape を確認しましょう。
  • train データの先頭を表示して中身を見ましょう。