1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Supervised Learning in R: Regression

Connected

Cvičení

Modelování logaritmicky transformovaného finančního výstupu

V tomto cvičení si procvičíš modelování logaritmicky transformovaného finančního výstupu a následný převod predikovaných hodnot „log-příjmu" zpět na finanční jednotky. Načtená data obsahují příjmy respondentů v roce 2005 (Income2005) a také výsledky několika testů způsobilosti, které respondenti absolvovali v roce 1981:

  • Arith
  • Word
  • Parag
  • Math
  • AFQT (percentil v testu ozbrojených sil – Armed Forces Qualifying Test)

Data jsou již rozdělena na trénovací a testovací sadu (income_train a income_test) a předem načtena. Sestavíš model pro log(příjem) na základě vstupních proměnných a výsledek pak převedeš zpět na příjem.

Pokyny

100 XP
  • Zavolej summary() na income_train$Income2005, abys viděl/a souhrnné statistiky příjmů v trénovací sadě.
  • Napiš vzorec vyjadřující log(Income2005) jako funkci pěti testů a ulož ho do proměnné fmla.log. Vypiš ho.
  • Natrénuj lineární model pro log(Income2005) na datech income_train: model.log.
  • Použij model.log k predikci příjmů na datové sadě income_test. Výsledek ulož do sloupce logpred.
    • Zkontroluj summary() proměnné logpred – hodnoty budou řádově jiné než hodnoty Income2005.
  • Proveď zpětnou transformaci logaritmu, aby byly predikce vyjádřeny ve finančních jednotkách: exp(income_test$logpred).
    • Zkontroluj summary() proměnné pred.income – hodnoty by teď měly být řádově podobné hodnotám Income2005.
  • Doplň chybějící části kódu a vykresli bodový graf predikovaného příjmu vs. skutečného příjmu na testovací sadě.