1. Nauka
  2. /
  3. Kursy
  4. /
  5. Preprocessing w uczeniu maszynowym w Pythonie

Connected

ćwiczenie

Wyodrębnianie wzorców z tekstu

Kolumna Length w zbiorze danych hiking zawiera ciągi znaków, w których ukryty jest dystans trasy w milach. Wyodrębnimy ten dystans za pomocą wyrażeń regularnych, a następnie użyjemy funkcji lambda w pandas, aby zastosować to wyodrębnianie do całego DataFrame.

Instrukcje

100 XP
  • Przeszukaj tekst przekazany w argumencie length w poszukiwaniu liczb i cyfr dziesiętnych, używając odpowiedniego wzorca.
  • Wyodrębnij dopasowany wzorzec i przekształć go na liczbę zmiennoprzecinkową.
  • Zastosuj funkcję return_mileage() do każdego wiersza w kolumnie hiking["Length"].