1. Learn
  2. /
  3. Cursuri
  4. /
  5. Gândire statistică în Python (Partea 2)

Connected

exercițiu

O funcție pentru bootstrap pe perechi

Așa cum s-a discutat în videoclip, bootstrap-ul pe perechi presupune reeșantionarea perechilor de date. Fiecare colecție de perechi este ajustată cu o dreaptă, în acest caz folosind np.polyfit(). Repetăm acest proces de mai multe ori, obținând replici bootstrap ale valorilor parametrilor. Pentru a dispune de un instrument util pentru bootstrap pe perechi, vei scrie o funcție care să realizeze această tehnică pe un set de date x,y.

Instrucțiuni

100 XP
  • Definește o funcție cu semnătura draw_bs_pairs_linreg(x, y, size=1) pentru a calcula estimări bootstrap pe perechi pentru parametrii regresiei liniare.
    • Folosește np.arange() pentru a crea un array de indici de la 0 la len(x). Aceștia sunt indicii pe care îi vei reeșantiona și îi vei folosi pentru a selecta valori din array-urile x și y.
    • Folosește np.empty() pentru a inițializa array-urile de replici ale pantei și interceptării, cu dimensiunea size.
    • Scrie o buclă for care să:
      • Reeșantioneze indicii inds. Folosește np.random.choice() pentru aceasta.
      • Creeze noi array-uri \(x\) și \(y\), numite bs_x și bs_y, folosind indicii reeșantionați bs_inds. Aplică slice pe x și y cu bs_inds.
      • Aplice np.polyfit() pe noile array-uri \(x\) și \(y\) și să stocheze panta și interceptarea calculate.
    • Returnează replicile bootstrap pe perechi ale pantei și interceptării.