Aan de slagBegin gratis

Belang van features

Hoewel sommige snoepattributen, zoals chocolade, heel populair kunnen zijn, betekent dat niet dat ze belangrijk zijn voor de modelvoorspelling. Nadat een random forest-model is getraind, kun je het modelattribuut .feature_importances_ bekijken om te zien welke variabelen de grootste impact hadden. Je kunt controleren hoe belangrijk elke variabele was in het model door over de feature-importance-array te loopen met enumerate().

Als je Python’s enumerate()-functie niet kent: die kan over een lijst loopen en tegelijk automatisch een teller bijhouden.

Deze oefening maakt deel uit van de cursus

Modelvalidatie in Python

Bekijk cursus

Oefeninstructies

  • Loop door de feature-importance-output van rfr.
  • Print de kolomnamen van X_train en de bijbehorende importancescore voor die kolom.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Fit the model using X and y
rfr.fit(X_train, y_train)

# Print how important each column is to the model
for i, item in enumerate(rfr.____):
      # Use i and item to print out the feature importance of each column
    print("{0:s}: {1:.2f}".format(X_train.columns[____], ____))
Code bewerken en uitvoeren