Crear variables ficticias
Poder incluir rasgos categóricos en el proceso de construcción del modelo puede mejorar el rendimiento, ya que pueden añadir información que contribuya a la precisión de la predicción.
El conjunto de datos music_df
se ha cargado previamente para ti, y se imprime su forma. Además, pandas
se ha importado como pd
.
Ahora crearás un nuevo DataFrame que contenga las columnas originales de music_df
más las variables ficticias de la columna "genre"
.
Este ejercicio forma parte del curso
Aprendizaje supervisado con scikit-learn
Instrucciones de ejercicio
- Utiliza una función pertinente, pasándole el DataFrame
music_df
completo, para crearmusic_dummies
, eliminando la primera columna binaria. - Imprime la forma de
music_dummies
.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Create music_dummies
music_dummies = ____
# Print the new DataFrame's shape
print("Shape of music_dummies: {}".format(____))