Promedios de segmentación con NMF

Por último, vas a explorar visualmente los valores medios de la solución de 3 segmentos construida con NMF y podrás compararla con la de K-means. Aquí extraerás la matriz de características W, que usaremos para obtener la asignación dura de segmentos eligiendo, para cada cliente, el valor de columna (segmento) con el valor más alto asociado en esta matriz.

Hemos cargado la librería pandas como pd y la librería seaborn como sns. Se ha importado el conjunto de datos bruto wholesale, y también la instancia ya ajustada de NMF con 3 segmentos como nmf. El conjunto de datos components se ha cargado como un DataFrame de pandas.

Este ejercicio forma parte del curso

Machine Learning para marketing en Python

Ver curso

Instrucciones del ejercicio

Crea la matriz W pasando los valores transformados como datos y los índices de components como nombres de columnas.
Asigna el valor de segmento seleccionando el nombre de la columna donde el valor correspondiente sea el mayor.
Calcula los valores medios de las columnas para cada segmento.
Representa los valores medios como un mapa de calor.

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Create the W matrix
W = pd.DataFrame(data=nmf.___(wholesale), columns=components.index)
W.index = wholesale.index

# Assign the column name where the corresponding value is the largest
wholesale_nmf3 = wholesale.___(segment = W.idxmax(axis=1))

# Calculate the average column values per each segment
nmf3_averages = wholesale_nmf3.___('___').mean().round(0)

# Plot the average values as heatmap
sns.___(___.T, cmap='YlGnBu')

# Display the chart
plt.show()

Editar y ejecutar código