Riduci l'asimmetria delle variabili
Ora trasformerai le colonne di wholesale usando la trasformazione di Box-Cox, quindi esplorerai il grafico delle relazioni a coppie per verificare che l'asimmetria delle distribuzioni sia stata ridotta rendendole più normali. Questo è un passaggio fondamentale per assicurarti che l'algoritmo K-means converga e scopra gruppi omogenei (ovvero cluster o segmenti) di osservazioni.
Il modulo stats è caricato dalla libreria scipy e il dataset wholesale è stato importato come DataFrame pandas.
Questo esercizio fa parte del corso
Machine Learning per il marketing con Python
Istruzioni dell'esercizio
- Definisci una funzione personalizzata di trasformazione Box-Cox che possa essere applicata a un DataFrame
pandas. - Applica la funzione al dataset
wholesale. - Traccia le relazioni a coppie tra le variabili trasformate.
- Visualizza il grafico.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Define custom Box Cox transformation function
def boxcox_df(x):
x_boxcox, _ = stats.___(x)
return x_boxcox
# Apply the function to the `wholesale` dataset
wholesale_boxcox = ___.___(boxcox_df, axis=0)
# Plot the pairwise relationships between the transformed variables
sns.___(___, diag_kind='kde')
# Display the chart
plt.___()