1. Nauka
  2. /
  3. Kursy
  4. /
  5. Myślenie statystyczne w Pythonie (część 1)

Connected

ćwiczenie

Obliczanie ECDF

W tym ćwiczeniu napiszesz funkcję, która przyjmuje jednowymiarową tablicę danych i zwraca wartości x oraz y empirycznej dystrybuanty (ECDF). Będziesz korzystać z tej funkcji wielokrotnie w tym kursie i jego kontynuacji. ECDF to jedne z najważniejszych wykresów w analizie statystycznej. Możesz napisać własną funkcję, foo(x,y), korzystając z poniższego szablonu:

def foo(a,b):
    """State what function does here"""
    # Computation performed here
    return x, y

Funkcja foo() przyjmuje dwa argumenty, a i b, i zwraca dwie wartości: x oraz y. Nagłówek funkcji def foo(a,b): zawiera sygnaturę foo(a,b), na którą składają się nazwa funkcji i jej parametry.

Instrukcje

100 XP
  • Zdefiniuj funkcję o sygnaturze ecdf(data). W ciele funkcji:
    • Oblicz liczbę punktów danych, n, używając funkcji len().
    • Wartości \(x\) to posortowane dane. Do sortowania użyj funkcji np.sort().
    • Wartości \(y\) dystrybuanty ECDF powinny rosnąć równomiernie od 1/n do 1. Możesz je zbudować za pomocą np.arange(). Pamiętaj jednak, że wartość końcowa w np.arange() nie jest uwzględniana. Dlatego zakres powinien obejmować wartości od 1 do n+1. Pamiętaj, żeby podzielić wynik przez n.
    • Funkcja powinna zwracać wartości x i y.