1. Learn
  2. /
  3. Cursuri
  4. /
  5. Reducerea dimensionalității în Python

Connected

exercițiu

Construirea unui clasificator pentru diabet

Vei folosi setul de date Pima Indians diabetes pentru a prezice dacă o persoană are diabet, folosind regresia logistică. Setul de date conține 8 caracteristici și o variabilă țintă. Datele au fost împărțite într-un set de antrenament și unul de testare și sunt preîncărcate ca X_train, y_train, X_test și y_test.

O instanță StandardScaler() a fost predefinită ca scaler, iar una LogisticRegression() ca lr.

Instrucțiuni

100 XP
  • Aplică fit pe scaler folosind caracteristicile de antrenament și transformă-le imediat, într-un singur pas.
  • Antrenează modelul de regresie logistică pe datele de antrenament scalate.
  • Scalează caracteristicile de test.
  • Prezice prezența diabetului pe setul de test scalat.