1. Learn
  2. /
  3. Курси
  4. /
  5. Тестування гіпотез у Python

Connected

вправа

Перевірка розміру вибірки

Щоб виконати перевірку гіпотези й бути впевненими, що результат коректний, вибірка має відповідати трьом вимогам: вона є випадковою вибіркою з генеральної сукупності, спостереження незалежні, і спостережень достатньо. Із цих умов лише останню легко перевірити кодом.

Мінімальний розмір вибірки залежить від типу перевірки гіпотез, яку ви плануєте виконувати. Зараз ви перевірите кілька сценаріїв на наборі даних late_shipments.

Зверніть увагу, що метод .all() з pandas можна використати, щоб перевірити, чи всі елементи є істинними. Наприклад, маючи датафрейм df із числовими значеннями, ви можете перевірити, чи всі елементи менші за 5, використавши (df < 5).all().

late_shipments доступний, а pandas імпортовано як pd.

Інструкції 1/4

undefined XP
  • 1
    • Отримайте кількість кожного значення у стовпці freight_cost_group датафрейму late_shipments.
    • Підставте відповідне число, щоб перевірити, чи лічильники "достатньо великі" для двовибіркового t-тесту.
  • 2
    • Отримайте кількість кожного значення у стовпці late датафрейму late_shipments.
    • Підставте відповідне число, щоб перевірити, чи лічильники "достатньо великі" для одновибіркового тесту частки.
  • 3
    • Отримайте кількість кожного значення у стовпці freight_cost_group датафрейму late_shipments, згрупувавши за vendor_inco_term.
    • Підставте відповідне число, щоб перевірити, чи лічильники "достатньо великі" для критерію незалежності хі-квадрат.
  • 4
    • Отримайте кількість кожного значення у стовпці shipment_mode датафрейму late_shipments.
    • Підставте відповідне число, щоб перевірити, чи лічильники "достатньо великі" для ANOVA.