Aan de slagGa gratis aan de slag

Normaliseren en standaardiseren

Feature scaling zorgt ervoor dat geen enkele feature de rest overheerst tijdens het modelleren. Normaliseren en standaardiseren zijn veelgebruikte technieken voor feature scaling. Normaliseren schaalt features meestal naar het bereik [0, 1], zodat ze ongeveer dezelfde schaal hebben. Standaardiseren zet de data om naar een gemiddelde van nul en een variantie van één. Hierdoor blijft er meer informatie over uitschieters behouden en is het bereik niet begrensd. matplotlib.pyplot is geïmporteerd als plt, MinMaxScaler en StandardScaler zijn geïmporteerd, en de gesplitste features van de hartziektedata zijn geïmporteerd als X_train en X_test.

Deze oefening maakt deel uit van de cursus

End-to-End Machine Learning

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Show the initial distribution of 'age'
age = ____
plt.figure(figsize=(10,5))
plt.hist(____, bins=30, alpha=0.5, label='Original')
plt.legend(prop={'size': 16})
plt.title('Histogram with Original Age'); 
plt.xlabel('Age'); plt.ylabel('Count');
plt.show()
Code bewerken en uitvoeren