Normalización de registros en Python
Ahora que sabemos que la columna Proline
de nuestro conjunto de datos wine
tiene una gran cantidad de varianza, vamos a aplicar la normalización logarítmica.
numpy
se ha importado como np
.
Este ejercicio forma parte del curso
Preprocesamiento para machine learning en Python
Instrucciones de ejercicio
- Imprime la varianza de la columna
Proline
como referencia. - Utiliza la función
np.log()
en la columnaProline
para crear una nueva columna log-normalizada llamadaProline_log
. - Imprime la varianza de la columna
Proline_log
para ver la diferencia.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Print out the variance of the Proline column
print(____)
# Apply the log normalization function to the Proline column
wine[____] = np.____(____)
# Check the variance of the normalized Proline column
print(____)