MulaiMulai sekarang secara gratis

Pra-pemrosesan data

Pra-pemrosesan untuk pengelompokan dapat menjadi cara menyiapkan data agar segmentasi lebih akurat. Salah satu jenis pra-pemrosesan adalah penskalaan fitur, teknik untuk menstandarkan fitur independen dalam data agar sesuai dengan rentang tetap, misalnya 0–1 atau 0–100.

Dalam latihan ini, Anda akan melakukan pengelompokan pada kolom parental_level_of_education dan writing_score dalam himpunan data kinerja siswa yang dimuat sebagai performance. Pertama, Anda akan membuat dan menjalankan model k-means tanpa pra-pemrosesan data apa pun. Lalu, lakukan hal yang sama tetapi dengan melakukan pra-pemrosesan data menggunakan penskalaan fitur.

Model k-means privat telah diimpor sebagai KMeans dari diffprivlib.models. Skaler StandardScaler dan reduksi dimensi PCA telah diimpor dari sklearn.

Latihan ini adalah bagian dari kursus

Privasi Data dan Anonimisasi di Python

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Build the differentially private k-means model
model = KMeans(____)

# Fit the model to the data
____

# Print the inertia in the console output
print("The inertia of the private model is: ", model.inertia_)
Edit dan Jalankan Kode