Mempelajari residual
Untuk menerapkan model linear, Anda harus mempelajari residual, yaitu jarak antara nilai prediksi dan data.
Tiga kondisi harus dipenuhi:
- Rata-ratanya harus 0.
- Variansnya harus konstan.
- Distribusinya harus normal.
Kita akan bekerja dengan data nilai ujian untuk dua sekolah, A dan B, pada mata pelajaran yang sama. model_A dan model_B dipasangkan masing-masing dengan hours_of_study_A dan test_scores_A, serta hours_of_study_B dan test_scores_B.
matplotlib.pyplot telah diimpor sebagai plt, numpy sebagai np, dan LinearRegression dari sklearn.linear_model.
Latihan ini adalah bagian dari kursus
Dasar-Dasar Probabilitas di Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Scatterplot of hours of study and test scores
plt.scatter(____, ____)
# Plot of hours_of_study_values_A and predicted values
plt.plot(____, model_A.____(hours_of_study_values_A))
plt.title("Model A", fontsize=25)
plt.show()