1. Learn
  2. /
  3. Courses
  4. /
  5. Uczenie nienadzorowane w Pythonie

Connected

Exercise

Skalowanie danych o rybach przed grupowaniem

Masz do dyspozycji tablicę samples zawierającą pomiary ryb. Każdy wiersz reprezentuje jedną rybę. Pomiary – takie jak masa w gramach, długość w centymetrach czy procentowy stosunek wysokości do długości – mają bardzo różne skale. Aby skutecznie pogrupować te dane, najpierw trzeba je wystandaryzować. W tym ćwiczeniu zbudujesz potok, który połączy standaryzację z grupowaniem.

Dane o pomiarach ryb pochodzą z Journal of Statistics Education.

Instructions

100 XP
  • Zaimportuj:
    • make_pipeline z sklearn.pipeline.
    • StandardScaler z sklearn.preprocessing.
    • KMeans z sklearn.cluster.
  • Utwórz instancję StandardScaler o nazwie scaler.
  • Utwórz instancję KMeans z 4 skupieniami o nazwie kmeans.
  • Utwórz potok o nazwie pipeline, który łączy scaler i kmeans. Wystarczy przekazać je jako argumenty do make_pipeline().