IniziaInizia gratis

Riduci l'asimmetria delle variabili

Ora trasformerai le colonne di wholesale usando la trasformazione di Box-Cox, quindi esplorerai il grafico delle relazioni a coppie per verificare che l'asimmetria delle distribuzioni sia stata ridotta rendendole più normali. Questo è un passaggio fondamentale per assicurarti che l'algoritmo K-means converga e scopra gruppi omogenei (ovvero cluster o segmenti) di osservazioni.

Il modulo stats è caricato dalla libreria scipy e il dataset wholesale è stato importato come DataFrame pandas.

Questo esercizio fa parte del corso

Machine Learning per il marketing con Python

Visualizza il corso

Istruzioni dell'esercizio

  • Definisci una funzione personalizzata di trasformazione Box-Cox che possa essere applicata a un DataFrame pandas.
  • Applica la funzione al dataset wholesale.
  • Traccia le relazioni a coppie tra le variabili trasformate.
  • Visualizza il grafico.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Define custom Box Cox transformation function
def boxcox_df(x):
    x_boxcox, _ = stats.___(x)
    return x_boxcox

# Apply the function to the `wholesale` dataset
wholesale_boxcox = ___.___(boxcox_df, axis=0)

# Plot the pairwise relationships between the transformed variables 
sns.___(___, diag_kind='kde')

# Display the chart
plt.___()
Modifica ed esegui il codice