Pre-elaborazione dei dati
La pre-elaborazione per il clustering può essere un modo per preparare i dati a una segmentazione più accurata. Un tipo di pre-elaborazione è il feature scaling, una tecnica che standardizza le feature indipendenti presenti nei dati per farle rientrare in un intervallo fisso, ad esempio 0-1 o 0-100.
In questo esercizio effettuerai il clustering sulle colonne parental_level_of_education e writing_score nel dataset delle performance degli studenti caricato come performance. Per prima cosa, creerai ed eseguirai un modello k-means senza alcuna pre-elaborazione. Poi ripeterai gli stessi passaggi, ma pre-elaborando i dati con il feature scaling.
Il modello k-means privato è stato importato come KMeans da diffprivlib.models. Lo scaler StandardScaler e la riduzione dimensionale PCA sono stati importati da sklearn.
Questo esercizio fa parte del corso
Riservatezza dei dati e anonimizzazione in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Build the differentially private k-means model
model = KMeans(____)
# Fit the model to the data
____
# Print the inertia in the console output
print("The inertia of the private model is: ", model.inertia_)