1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phát hiện bất thường với Python

Connected

Bài tập

Tinh chỉnh contamination

Cuối cùng cũng đến lúc tinh chỉnh tham số contamination “khó nhằn”. Hai hàm evaluate_outlier_classifier và evaluate_regressor trong video đã được nạp sẵn cho bạn. Bạn có thể xem chúng bên dưới.

def evaluate_outlier_classifier(model, data):
    # Get labels
    labels = model.fit_predict(data)

    # Return inliers
    return data[labels == 0]
def evaluate_regressor(inliers):
    X = inliers.drop("price", axis=1)
    y = inliers[['price']]
    X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=10)

    lr = LinearRegression()
    lr.fit(X_train, y_train)

    preds = lr.predict(X_test)
    rmse = root_mean_squared_error(y_test, preds)

    return round(rmse, 3)

Bạn sẽ sử dụng một mẫu của bộ dữ liệu US Airbnb Listings, đã được nạp sẵn dưới tên airbnb_df.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Tạo một danh sách tên contaminations chứa bốn giá trị 0.07, 0.1, 0.15, 0.25, và tạo một từ điển rỗng tên scores để lưu các điểm RMSE.