1. Learn
  2. /
  3. Cursuri
  4. /
  5. Confidențialitatea datelor și anonimizarea în Python

Connected

exercițiu

Generarea seturilor de date pentru clasificare

Găsirea unui set de date real care să îndeplinească toate combinațiile dorite de criterii poate fi complicată și, dacă este colectat, poate ridica probleme de confidențialitate. Ca soluție, poți folosi generatoare de seturi de date pentru a obține aproximări bune ale seturilor de date din lumea reală.

În acest exercițiu, vei crea un set de date de dimensiuni mari pentru o problemă de clasificare cu 3 clase. Pentru a vizualiza cu ușurință datele generate ca un grafic de tip scatter, a fost furnizată o funcție personalizată numită plot_data_points().

Instrucțiuni

100 XP
  • Importă funcția corespunzătoare din sklearn.datasets pentru generarea seturilor de date de clasificare.
  • Generează 5000 de eșantioane cu 4 caracteristici, 1 cluster per clasă, 3 clase și o separare între clase de 2.
  • Afișează forma datelor generate.
  • Observă graficul de tip scatter rezultat.