1. Nauka
  2. /
  3. Kursy
  4. /
  5. Myślenie statystyczne w Pythonie (część 2)

Connected

ćwiczenie

Na czym polega optymalność?

Funkcja np.polyfit(), której użyłeś do wyznaczenia parametrów regresji, wyznacza optymalne nachylenie i wyraz wolny. Optymalizuje ona sumę kwadratów reszt, czyli RSS (ang. residual sum of squares). W tym ćwiczeniu wykreślisz funkcję podlegającą optymalizacji – RSS – w zależności od parametru nachylenia a. W tym celu ustal wyraz wolny na wartość uzyskaną podczas optymalizacji, a następnie narysuj wykres RSS w funkcji nachylenia. Gdzie jest ono minimalne?

Instrukcje

100 XP
  • Określ wartości nachylenia, dla których obliczysz RSS. Użyj np.linspace(), aby uzyskać 200 punktów w przedziale od 0 do 0.1. Na przykład, aby uzyskać 100 punktów w przedziale od 0 do 0.5, możesz użyć np.linspace() w następujący sposób: np.linspace(0, 0.5, 100).
  • Zainicjuj tablicę rss do przechowywania wartości RSS, używając np.empty_like() i tablicy utworzonej powyżej. Funkcja empty_like() zwraca nową tablicę o tym samym kształcie i typie co podana tablica (w tym przypadku a_vals).
  • Napisz pętlę for, która oblicza sumę RSS dla nachylenia. Podpowiedź: RSS wyraża się wzorem np.sum((y_data - a * x_data - b)**2). Zmienna b obliczona w poprzednim ćwiczeniu jest już dostępna w twoim przestrzeni nazw. Tutaj fertility to y_data, a illiteracy to x_data.
  • Wykreśl RSS (rss) w zależności od nachylenia (a_vals).
  • Kliknij Prześlij odpowiedź, aby zobaczyć wykres!