Crear variables ficticias

Poder incluir rasgos categóricos en el proceso de construcción del modelo puede mejorar el rendimiento, ya que pueden añadir información que contribuya a la precisión de la predicción.

El conjunto de datos music_df se ha cargado previamente para ti, y se imprime su forma. Además, pandas se ha importado como pd.

Ahora crearás un nuevo DataFrame que contenga las columnas originales de music_df más las variables ficticias de la columna "genre".

Este ejercicio forma parte del curso

Aprendizaje supervisado con scikit-learn

Ver curso

Instrucciones de ejercicio

  • Utiliza una función pertinente, pasándole el DataFrame music_df completo, para crear music_dummies, eliminando la primera columna binaria.
  • Imprime la forma de music_dummies.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Create music_dummies
music_dummies = ____

# Print the new DataFrame's shape
print("Shape of music_dummies: {}".format(____))