1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. Machine Learning for Finance in Python

Connected

Exercises

Důležitost příznaků v náhodném lese

Jednou z užitečných vlastností stromových metod je možnost extrahovat důležitost příznaků. Jde o kvantitativní způsob, jak změřit, jak moc každý příznak přispívá k našim předpovědím. Pomůže ti soustředit se na nejdůležitější příznaky, případně je vylepšit nebo doladit, a zároveň se zbavit těch zbytečných, které model zbytečně zatěžují.

Stromové modely v sklearn mají po natrénování přístupnou vlastnost .feature_importances_, která uchovává skóre důležitosti příznaků. Abychom mohli vytvořit přehledný sloupcový graf (seřazený od nejdůležitějšího po nejméně důležitý příznak), potřebujeme získat indexy seřazených hodnot pomocí np.argsort().

คำแนะนำ

100 XP
  • Pomocí vlastnosti feature_importances_ našeho modelu náhodného lesa (rfr) extrahuj důležitost příznaků do proměnné importances.
  • Pomocí argsort z NumPy získej indexy příznaků seřazené od největší po nejmenší důležitost a ulož je do proměnné sorted_index.
  • Nastav popisky na ose x jako názvy příznaků v proměnné labels s využitím seznamu sorted_index. feature_names je třeba nejdřív převést na pole NumPy, abychom ho mohli indexovat pomocí sorted_index.