1. Learn
  2. /
  3. Cursuri
  4. /
  5. Ingineria caracteristicilor pentru Machine Learning în Python

Connected

exercițiu

Transformări pe antrenament și testare (II)

Similar cu aplicarea aceluiași scaler atât pe setul de antrenament, cât și pe cel de testare, dacă ai eliminat valorile aberante din setul de antrenament, cel mai probabil vei dori să faci același lucru și pentru setul de testare. Din nou, asigură-te că folosești pragurile calculate exclusiv din setul de antrenament pentru a elimina valorile aberante din setul de testare.

Ca și în exercițiul anterior, am împărțit DataFrame-ul so_numeric_df în seturile de antrenament (so_train_numeric) și de testare (so_test_numeric).

Instrucțiuni

100 XP
  • Calculează abaterea standard și media coloanei ConvertedSalary.
  • Calculează limitele superioară și inferioară ca fiind la trei abateri standard față de medie, în ambele direcții.
  • Filtrează DataFrame-ul so_test_numeric pentru a păstra doar rândurile în care ConvertedSalary se află între limita inferioară și cea superioară.