Membangun model regresi linear
Sejak 2015, survei gaji anonim telah dilakukan setiap tahun di kalangan spesialis TI Eropa. Pada 2018, ratusan responden berpartisipasi secara sukarela. Dalam data survei tersebut terdapat jumlah tahun pengalaman yang dimiliki responden dan gaji mereka saat ini.
Anda akan menganalisis hubungan antara kedua variabel ini untuk mengetahui apakah lebih banyak tahun pengalaman berpengaruh pada gaji yang lebih tinggi atau lebih rendah.
Variabel independen Anda adalah experience_years, dan variabel dependen Anda adalah current_salary.
Data telah dimuat untuk Anda sebagai data, bersama dengan statsmodels.api dan pandas, masing-masing sebagai sm dan pd.
Latihan ini adalah bagian dari kursus
Menganalisis Data Survei di Python
Petunjuk latihan
- Definisikan variabel
xdany. - Tambahkan suku konstanta.
- Jalankan regresi
OLS()dan.fit()modelnya. - Cetak tabel ringkasan.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Define variable, x and y
x = salary_survey.____.____
y = salary_survey.____.____
# Add the constant term
x = ____.____(x)
# Perform .OLS() regression and fit
result = ____.____(y,x).____()
# Print the summary table
print(____.____())