1. Learn
  2. /
  3. Cursuri
  4. /
  5. Proiectarea fluxurilor de lucru pentru Machine Learning în Python

Connected

exercițiu

Ajustarea dimensiunii ferestrei

Vrei să verifici personal că dimensiunea optimă a ferestrei pentru setul de date privind aritmia este 50. Ți s-a pus la dispoziție setul de date sub forma unui DataFrame pandas numit arrh și vrei să folosești un subset al datelor până la momentul t_now. Datele de testare sunt disponibile ca X_test și y_test. Vei testa mai multe dimensiuni de fereastră, de la 10 la 100, vei antrena un clasificator Naïve Bayes pentru fiecare fereastră, vei evalua scorul F1 pe datele de testare și vei alege dimensiunea cu cea mai bună performanță. Ai la dispoziție și numpy importat ca np, iar funcția f1_score() a fost deja importată. În plus, o listă goală numită accuracies a fost inițializată pentru a stoca acuratețile fiecărei ferestre.

Instrucțiuni

100 XP
  • Definește indexul unei ferestre glisante de dimensiune w_size care se oprește la t_now, folosind metoda .loc().
  • Construiește X din fereastra glisantă prin eliminarea coloanei class. Stochează această coloană ca y.
  • Antrenează un clasificator Naïve Bayes pe X și y, apoi folosește-l pentru a prezice etichetele datelor de testare X_test.
  • Calculează scorul F1 al acestor predicții pentru fiecare dimensiune de fereastră și identifică dimensiunea cu cea mai bună performanță.