1. Learn
  2. /
  3. Courses
  4. /
  5. Proiectarea fluxurilor de lucru pentru Machine Learning în Python

Connected

Exercise

Transformarea unei euristici într-un clasificator

Ești surprins să descoperi cât de utile pot fi euristicile. Așa că decizi să tratezi euristica „prea multe porturi unice sunt suspecte" ca pe un clasificator de sine stătător. Obții acest lucru pragând numărul de porturi unice per sursă față de media utilizată de computerele sursă rău-intenționate — adică cele pentru care eticheta este True. Setul de date este preîncărcat și împărțit în antrenament și test, astfel că ai în memorie obiectele X_train, X_test, y_train și y_test. Importurile includ accuracy_score() și numpy ca np. De precizat: în acest exercițiu nu vei antrena un clasificator din scikit-learn, ci vei defini explicit propria regulă de clasificare!

Instructions

100 XP
  • Selectează toate gazdele rău-intenționate din X_train pentru a forma un nou set de date, X_train_bad. Reține că y_train este un array de valori booleene.
  • Calculează media coloanei unique_ports pentru gazdele rău-intenționate și stocheaz-o în avg_bad_ports.
  • Definește acum un clasificator care prezice ca pozitiv orice exemplu al cărui unique_ports depășește avg_bad_ports. Salvează predicțiile acestui clasificator pe datele de test într-o nouă variabilă, pred_port.
  • Calculează acuratețea acestui clasificator pe datele de test folosind accuracy_score().