1. Обучение
  2. /
  3. Курса
  4. /
  5. Python で学ぶ Machine Learning のための特徴量エンジニアリング

Connected

упражнение

データはどんな形をしていますか?(I)

これまでに皆さんは、新しい特徴量の作成や、データ内の問題への対処に取り組んできました。Feature engineering は、手元にあるデータを最大限に活用し、Machine Learning モデルを作る際により効果的に使うためにも役立ちます。 多くのアルゴリズムは、データが正規分布に従っている、もしくは少なくともすべての列が同じスケールであると仮定することがあります。実際にはそうでないことが多く、例えばある特徴量は数千ドル単位、別の特徴量は年数で測定されている、といったことが起きます。この演習では、so_survey_df データフレームから抽出した数値列の so_numeric_df に対してプロットを作成し、いくつかの数値列の分布を確認します。

Инструкции 1/3

undefined XP
    1
    2
    3

so_numeric_df データフレーム内のすべての列について、ヒストグラムを作成してください。