ComenzarEmpieza gratis

Crea un clasificador con privacidad diferencial

En este ejercicio, vas a crear y entrenar un modelo privado de Gaussian Naive Bayes con el conjunto de datos de pingüinos para clasificar si un pingüino es macho o hembra.

K-anonymity no funciona bien con conjuntos de datos de alta dimensión o muy diversos debido a sus importantes limitaciones teóricas y empíricas, la “maldición de la dimensionalidad”. A medida que crece el número de características o dimensiones, la cantidad de datos necesaria para generalizar correctamente crece de forma exponencial. Es una de las razones por las que la privacidad diferencial es el modelo de privacidad preferido actualmente. Épsilon es independiente de cualquier conocimiento previo y “acota” la información sensible.

El DataFrame está cargado como penguin_df y dividido en X_train, y_train, X_test y y_test. La clase del modelo privado se ha importado como dp_GaussianNB.

Este ejercicio forma parte del curso

Privacidad de datos y anonimización en Python

Ver curso

Instrucciones del ejercicio

  • Crea un clasificador dp_GaussianNB sin parámetros.
  • Ajusta el modelo que has creado a los datos sin ningún parámetro.
  • Calcula la puntuación del modelo privado usando los datos de prueba.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Built the private classifier without parameters
dp_clf = ____

# Fit the model to the data
____(X_train, y_train)

# Print the accuracy score
print("The accuracy with default settings is ", ____(X_test, y_test))
Editar y ejecutar código