1. Nauka
  2. /
  3. Kursy
  4. /
  5. Inżynieria cech w uczeniu maszynowym w Pythonie

Connected

ćwiczenie

Binaryzacja kolumn

Wartości numeryczne często można wykorzystać bezpośrednio, bez żadnej inżynierii cech – jednak czasem pewna forma przekształcenia okazuje się przydatna. Na przykład w niektórych sytuacjach nie interesuje cię wielkość danej wartości, lecz tylko jej kierunek albo sam fakt jej istnienia. W takich przypadkach warto zastosować binaryzację kolumny. W zbiorze danych so_survey_df duża część respondentów pracuje na zasadzie wolontariatu (bez wynagrodzenia). Utwórz nową kolumnę o nazwie Paid_Job, która będzie wskazywać, czy dana osoba otrzymuje wynagrodzenie (tj. czy jej pensja jest większa od zera).

Instrukcje

100 XP
  • Utwórz nową kolumnę o nazwie Paid_Job wypełnioną zerami.
  • Zastąp wszystkie wartości w kolumnie Paid_Job jedynką wszędzie tam, gdzie odpowiadająca wartość ConvertedSalary jest większa od 0.