Aan de slagBegin gratis

Normaliseren en standaardiseren

Feature scaling zorgt ervoor dat geen enkele feature de rest overheerst tijdens het modelleren. Normaliseren en standaardiseren zijn veelgebruikte technieken voor feature scaling. Normaliseren schaalt features meestal naar het bereik [0, 1], zodat ze ongeveer dezelfde schaal hebben. Standaardiseren zet de data om naar een gemiddelde van nul en een variantie van één. Hierdoor blijft er meer informatie over uitschieters behouden en is het bereik niet begrensd. matplotlib.pyplot is geïmporteerd als plt, MinMaxScaler en StandardScaler zijn geïmporteerd, en de gesplitste features van de hartziektedata zijn geïmporteerd als X_train en X_test.

Deze oefening maakt deel uit van de cursus

End-to-End Machine Learning

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Show the initial distribution of 'age'
age = ____
plt.figure(figsize=(10,5))
plt.hist(____, bins=30, alpha=0.5, label='Original')
plt.legend(prop={'size': 16})
plt.title('Histogram with Original Age'); 
plt.xlabel('Age'); plt.ylabel('Count');
plt.show()
Code bewerken en uitvoeren