1. Nauka
  2. /
  3. Kursy
  4. /
  5. Prywatność danych i anonimizacja w Pythonie

Connected

ćwiczenie

Generowanie zbiorów danych do klasyfikacji

Znalezienie rzeczywistego zbioru danych spełniającego wszystkie pożądane kryteria może być trudne, a zebrane dane często rodzą obawy o prywatność. Rozwiązaniem jest użycie generatorów zbiorów danych, które dostarczają dobrych przybliżeń rzeczywistych danych.

W tym ćwiczeniu stworzysz duży zbiór danych dla problemu klasyfikacji 3-klasowej. Aby ułatwić wizualizację wygenerowanych danych jako wykres punktowy, udostępniono gotową funkcję plot_data_points().

Instrukcje

100 XP
  • Zaimportuj z sklearn.datasets odpowiednią funkcję do generowania zbiorów danych do klasyfikacji.
  • Wygeneruj 5000 próbek z 4 cechami, 1 skupiskiem na klasę, 3 klasami i separacją klas równą 2.
  • Wydrukuj kształt wygenerowanych danych.
  • Sprawdź powstały wykres punktowy.