1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Modeling with tidymodels in R

Connected

cvičení

Rozložení hodnot výstupní proměnné

Stratifikace podle výstupní proměnné při vytváření trénovací a testovací sady zajišťuje, že hodnoty výstupní proměnné mají v obou sadách podobné rozpětí.

Protože jsou původní data rozdělena náhodně, stratifikace zabraňuje tomu, aby se například všechny dražší nemovitosti z home_sales ocitly pouze v testovací sadě. V takovém případě by model pravděpodobně fungoval špatně, protože byl trénován na levnějších nemovitostech.

V tomto cvičení vypočítáš souhrnné statistiky pro proměnnou selling_price v trénovací a testovací sadě. Tibbles home_training a home_test byly načteny z předchozího cvičení.

Instrukce 1/2

undefined XP
  • 1
    • Vypočítej minimum, maximum, průměr a směrodatnou odchylku proměnné selling_price v home_training.
  • 2
    • Vypočítej minimum, maximum, průměr a směrodatnou odchylku proměnné selling_price v home_test.