IniziaInizia gratis

Pre-elaborazione dei dati

La pre-elaborazione per il clustering può essere un modo per preparare i dati a una segmentazione più accurata. Un tipo di pre-elaborazione è il feature scaling, una tecnica che standardizza le feature indipendenti presenti nei dati per farle rientrare in un intervallo fisso, ad esempio 0-1 o 0-100.

In questo esercizio effettuerai il clustering sulle colonne parental_level_of_education e writing_score nel dataset delle performance degli studenti caricato come performance. Per prima cosa, creerai ed eseguirai un modello k-means senza alcuna pre-elaborazione. Poi ripeterai gli stessi passaggi, ma pre-elaborando i dati con il feature scaling.

Il modello k-means privato è stato importato come KMeans da diffprivlib.models. Lo scaler StandardScaler e la riduzione dimensionale PCA sono stati importati da sklearn.

Questo esercizio fa parte del corso

Riservatezza dei dati e anonimizzazione in Python

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Build the differentially private k-means model
model = KMeans(____)

# Fit the model to the data
____

# Print the inertia in the console output
print("The inertia of the private model is: ", model.inertia_)
Modifica ed esegui il codice