1. Learn
  2. /
  3. Cursuri
  4. /
  5. Ingineria caracteristicilor pentru Machine Learning în Python

Connected

exercițiu

Transformări pe seturile de antrenament și de testare (I)

Până acum ai creat scalere pe baza unei coloane și le-ai aplicat pe aceleași date pe care au fost antrenate. Când construiești modele de machine learning, vei lucra în general cu date istorice (setul de antrenament) și vei aplica modelul pe date noi, nevăzute anterior (setul de testare). În aceste situații, trebuie să te asiguri că aceeași scalare este aplicată atât datelor de antrenament, cât și celor de testare.
Pentru a face asta în practică, antrenezi scalerul pe setul de antrenament și îl păstrezi pentru a-l aplica ulterior pe setul de testare. Nu trebuie să reantrenezi niciodată un scaler pe setul de testare.

Pentru acest exercițiu și pentru cel următor, am împărțit DataFrame-ul so_numeric_df în setul de antrenament (so_train_numeric) și setul de testare (so_test_numeric).

Instrucțiuni

100 XP
  • Instanțiază StandardScaler() ca SS_scaler.
  • Antrenează StandardScaler pe coloana Age.
  • Transformă coloana Age din setul de testare (so_test_numeric).