1. 학습
  2. /
  3. 강의
  4. /
  5. Inżynieria cech w uczeniu maszynowym w Pythonie

Connected

연습 문제

Transformacje na zbiorach treningowym i testowym (II)

Podobnie jak w przypadku stosowania tego samego skalera do zbiorów treningowego i testowego, jeśli usunięto wartości odstające ze zbioru treningowego, warto zrobić to samo ze zbiorem testowym. Ponownie zadbaj o to, aby do usuwania wartości odstających ze zbioru testowego używać progów obliczonych wyłącznie na zbiorze treningowym.

Podobnie jak w poprzednim ćwiczeniu, ramka danych so_numeric_df jest podzielona na zbiór treningowy (so_train_numeric) i testowy (so_test_numeric).

지침

100 XP
  • Oblicz odchylenie standardowe i średnią kolumny ConvertedSalary.
  • Wyznacz górną i dolną granicę jako trzy odchylenia standardowe od średniej w obu kierunkach.
  • Przytnij ramkę danych so_test_numeric, zachowując tylko wiersze, w których ConvertedSalary mieści się w wyznaczonych granicach.