Prozkoumání vysvětlujících proměnných

Když je výstupní proměnná logického typu, všechny body leží na přímkách \(y=0\) a \(y=1\), což ztěžuje pochopení toho, co se v datech děje. Ve videu nebylo zřejmé, jak je vysvětlující proměnná rozložena na každé z těchto přímek – dokud jsi neuviděl/a trendovou čáru. Řešením je histogram vysvětlující proměnné rozdělený podle výstupní proměnné.

Pomocí těchto histogramů se blíže seznámíš s datasetem odchodu klientů finančních služeb, který jsi viděl/a ve videu.

churn je k dispozici jako pandas DataFrame.

1
Pomocí volání sns.displot() na datech churn vykresli time_since_last_purchase jako dva histogramy rozdělené podle hodnot sloupce has_churned.

2
Překresli histogramy s použitím sloupce time_since_first_purchase, opět rozdělené podle hodnot sloupce has_churned.

cvičení

Prozkoumání vysvětlujících proměnných

Instrukce 1/2

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Instrukce 1/2

cvičení