Normalização e Padronização
O escalonamento de atributos ajuda a garantir que nenhum atributo domine os demais durante a modelagem. Normalização e Padronização são técnicas de escalonamento amplamente usadas. A normalização geralmente ajusta os atributos para o intervalo [0, 1], garantindo que tenham escalas semelhantes. A padronização transforma os dados para média zero e variância unitária, preservando mais informações sobre outliers e sem limitar o intervalo. matplotlib.pyplot foi importado como plt, MinMaxScaler e StandardScaler foram importados, e os atributos do conjunto de dados de doença cardíaca (divididos) foram importados como X_train e X_test.
Este exercício faz parte do curso
Machine Learning de ponta a ponta
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Show the initial distribution of 'age'
age = ____
plt.figure(figsize=(10,5))
plt.hist(____, bins=30, alpha=0.5, label='Original')
plt.legend(prop={'size': 16})
plt.title('Histogram with Original Age');
plt.xlabel('Age'); plt.ylabel('Count');
plt.show()