1. Nauka
  2. /
  3. Kursy
  4. /
  5. Analiza danych ankietowych w Pythonie

Connected

ćwiczenie

Dopasowywanie modelu regresji liniowej

Anonimowa ankieta płacowa jest przeprowadzana corocznie od 2015 roku wśród europejskich specjalistów IT. W 2018 roku setki respondentów zdecydowało się wziąć w niej udział. Dane z ankiety zawierają informacje o liczbie lat doświadczenia respondentów oraz ich aktualnym wynagrodzeniu.

Przeanalizujesz zależność między tymi dwiema zmiennymi, aby sprawdzić, czy większe doświadczenie wiąże się z wyższym czy niższym wynagrodzeniem.

Zmienna niezależna to experience_years, a zmienna zależna to current_salary.

Dane zostały wczytane jako data, a biblioteki statsmodels.api i pandas są dostępne odpowiednio jako sm i pd.

Instrukcje

100 XP
  • Zdefiniuj zmienne x i y.
  • Dodaj wyraz wolny (stałą).
  • Przeprowadź regresję OLS() i dopasuj model metodą .fit().
  • Wydrukuj tabelę podsumowania.