Menyetel contamination
Akhirnya, saatnya menyetel parameter contamination yang cukup terkenal ini. Fungsi evaluate_outlier_classifier dan evaluate_regressor dari video sudah dimuat untuk Anda. Anda dapat meninjaunya di bawah ini.
def evaluate_outlier_classifier(model, data):
# Get labels
labels = model.fit_predict(data)
# Return inliers
return data[labels == 0]
def evaluate_regressor(inliers):
X = inliers.drop("price", axis=1)
y = inliers[['price']]
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=10)
lr = LinearRegression()
lr.fit(X_train, y_train)
preds = lr.predict(X_test)
rmse = root_mean_squared_error(y_test, preds)
return round(rmse, 3)
Anda akan menggunakan sampel himpunan data US Airbnb Listings, yang sudah dimuat sebagai airbnb_df.
Latihan ini adalah bagian dari kursus
Deteksi Anomali dengan Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create a list of contaminations and an empty dictionary
contaminations = ____
scores = ____