1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶMachine Learningの前処理

Connected

演習

文字列パターンの抽出

hiking データセットの Length 列は文字列ですが、その中にハイキングの距離(マイル)が含まれています。ここでは正規表現を使ってこの距離を抽出し、pandas のラムダを使って DataFrame 全体に適用していきます。

指示

100 XP
  • length 引数の文字列から、数値および小数を探す適切なパターンで検索します。
  • マッチしたパターンを抽出し、float に変換します。
  • return_mileage() 関数を hiking["Length"] 列の各行に適用します。