Normalisasi dan Standardisasi
Penskalaan fitur membantu memastikan tidak ada fitur yang mendominasi fitur lain saat pemodelan. Normalisasi dan Standardisasi adalah teknik penskalaan fitur yang banyak digunakan. Normalisasi umumnya menskalakan fitur ke rentang [0, 1] sehingga memiliki skala yang kurang lebih sama. Standardisasi mentransformasikan data agar memiliki mean nol dan varians satu, mempertahankan lebih banyak informasi tentang pencilan dan tidak membatasi rentangnya. matplotlib.pyplot telah diimpor sebagai plt, MinMaxScaler dan StandardScaler telah diimpor, serta fitur data penyakit jantung yang telah dipisah telah diimpor sebagai X_train dan X_test.
Latihan ini adalah bagian dari kursus
Machine Learning Ujung ke Ujung
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Show the initial distribution of 'age'
age = ____
plt.figure(figsize=(10,5))
plt.hist(____, bins=30, alpha=0.5, label='Original')
plt.legend(prop={'size': 16})
plt.title('Histogram with Original Age');
plt.xlabel('Age'); plt.ylabel('Count');
plt.show()