1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Procvičování otázek k pohovorům z oblasti Machine Learning v Pythonu

Connected

Cvičení

Vizualizace separace tříd pomocí PCA I

Jednou z běžných otázek na pohovoru pro pozici v oblasti strojového učení je vizualizace dimenzionality po aplikaci PCA. V tomto cvičení to uděláš sám/sama – vykreslíš první 2 hlavní komponenty datasetu loan_data, abys vizualizoval/a separaci tříd podle toho, zda byl úvěr plně splacen nebo odepsán.

Dataset loan_data byl škálován a zakódován metodou one-hot encoding, což znamená, že kategorické proměnné byly převedeny na binární indikátory – před aplikací PCA totiž musí být všechny příznaky numerické a na stejné škále.

Model PCA se 2 hlavními komponentami a nastavení grafu s popisky os x, y a názvem jsou již připraveny za tebe. V cvičeních budeš pracovat s DataFrame loan_data_PCA. Cílová proměnná Loan Status může nabývat hodnot 0 a 1. Na osu x vyneseš PC1 a na osu y PC2.

Již naimportováno za tebe: matplotlib.pyplot jako plt, seaborn jako sns a PCA z sklearn.decomposition.

Pokyny 1/3

undefined XP
    1
    2
    3
  • Přiřaď hodnoty cílové proměnné do seznamu targets.
  • Předej právě vytvořené seznamy funkci zip() uvnitř cyklu for.
  • Předej do indicesToKeep instance, kde se Loan Status rovná target.