Bucketování

Pro kupce nemovitosti je klíčové, jestli má dům 1, 2, 3 nebo 4 ložnice. Jenže podobně jako u koupelen – od určitého bodu už nezáleží na tom, jestli jich je 7 nebo 8. V tomto příkladu se podíváme na to, jak najít vhodné hranice pro rozdělení hodnot do skupin (bucketů).

Vykresli distribuční graf pandas datového rámce sample_df pomocí funkce distplot() z knihovny Seaborn.
Protože se zdá, že po hodnotě 5 následuje dlouhý ocas s řídkými hodnotami, vytvoř hranice splits pro skupiny 1, 2, 3, 4, 5+
Vytvoř transformátor buck tak, že vytvoříš instanci Bucketizer() s definovanými hranicemi pro skupiny, vstupní sloupec nastav na BEDROOMS a výstupní sloupec na bedrooms.
Aplikuj transformaci Bucketizer na df pomocí transform() a výsledek ulož do df_bucket. Potom ověř výsledky pomocí show()

cvičení

Bucketování

Pokyny

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Pokyny

cvičení