1. Learn
  2. /
  3. Cursuri
  4. /
  5. Testarea ipotezelor în Python

Connected

exercițiu

Testarea dimensiunii eșantionului

Pentru a efectua un test de ipoteză și a te asigura că rezultatul este corect, un eșantion trebuie să îndeplinească trei condiții: să fie un eșantion aleatoriu din populație, observațiile să fie independente și să existe suficiente observații. Dintre acestea, doar ultima condiție poate fi verificată cu ușurință prin cod.

Dimensiunea minimă a eșantionului depinde de tipul de test de ipoteză pe care vrei să îl efectuezi. Vei testa acum câteva scenarii pe setul de date late_shipments.

Rețineți că metoda .all() din pandas poate fi folosită pentru a verifica dacă toate elementele sunt adevărate. De exemplu, pentru un DataFrame df cu valori numerice, poți verifica dacă toate elementele sunt mai mici decât 5 folosind (df < 5).all().

late_shipments este disponibil, iar pandas este încărcat ca pd.

Instrucțiuni 1/4

undefined XP
  • 1
    • Obține numărul de apariții ale fiecărei valori din coloana freight_cost_group a setului de date late_shipments.
    • Introdu un număr potrivit pentru a verifica dacă valorile sunt „suficient de mari" pentru un test t cu două eșantioane.
  • 2
    • Obține numărul de apariții ale fiecărei valori din coloana late a setului de date late_shipments.
    • Introdu un număr potrivit pentru a verifica dacă valorile sunt „suficient de mari" pentru un test de proporție cu un singur eșantion.
  • 3
    • Obține numărul de apariții ale fiecărei valori din coloana freight_cost_group a setului de date late_shipments, grupat după vendor_inco_term.
    • Introdu un număr potrivit pentru a verifica dacă valorile sunt „suficient de mari" pentru un test chi-pătrat de independență.
  • 4
    • Obține numărul de apariții ale fiecărei valori din coloana shipment_mode a setului de date late_shipments.
    • Introdu un număr potrivit pentru a verifica dacă valorile sunt „suficient de mari" pentru un test ANOVA.