1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning with PySpark

Connected

cvičení

Sestavení modelu logistické regrese

Model rozhodovacího stromu na letových datech už máš za sebou. Teď vytvoříš model logistické regrese na stejných datech.

Cílem je předpovědět, zda bude let pravděpodobně zpožděn alespoň o 15 minut (label 1), nebo ne (label 0).

Ačkoli máš k dispozici celou řadu prediktorů, prozatím použiješ jen sloupce mon, depart a duration. Jde o číselné příznaky, které lze pro model logistické regrese použít přímo. Než budeš moci zahrnout i kategoriální příznaky, bude potřeba trochu více práce. Brzy se k tomu dostaneme!

Data jsou rozdělena na trénovací a testovací sadu a jsou dostupná jako flights_train a flights_test.

Pokyny

100 XP
  • Importuj třídu pro vytvoření klasifikátoru logistické regrese.
  • Vytvoř objekt klasifikátoru a natrénuj ho na trénovacích datech.
  • Vygeneruj predikce pro testovací data a vytvoř matici záměn.