1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do modelowania liniowego w Pythonie

Connected

ćwiczenie

Ekstrapolacja: wyjście poza granice danych

W tym ćwiczeniu przyjrzymy się pułapkom ekstrapolacji. Na ilustracji widać profil szlaku turystycznego na górze. Fragment trasy zaznaczony na czarno wygląda liniowo i posłużył do zbudowania modelu. Jednak linia najlepszego dopasowania, zaznaczona na czerwono, nie opisuje dobrze danych spoza pierwotnej „dziedziny" – tam, gdzie wkracza w nowe dane oznaczone kolorem niebieskim.

Jeśli chcemy używać modelu do przewidywania wysokości i zachować dokładność mieszczącą się w pewnej tolerancji, jakie są najmniejsza i największa wartości zmiennej niezależnej x, dla których możemy zastosować ten model?

Skorzystaj z wczytanych wcześniej danych: x_data, y_data, y_model oraz funkcji plot_data_model_tolerance(), aby uzupełnić rozwiązanie.

Instrukcje

100 XP
  • Użyj np.abs(), aby obliczyć reszty jako różnice y_data - y_model.
  • Znajdź wartości .min() i .max() zmiennej x, dla których residuals są mniejsze niż tolerance = 100 metrów.
  • Użyj np.min() i np.max(), aby wyświetlić zakres (najmniejszą i największą) wartości x_good.
  • Użyj predefiniowanej funkcji plot_data_model_tolerance(), aby porównać dane, model i zakres wartości x_good, dla których warunek residuals < tolerance jest spełniony (True).