ComenzarEmpieza gratis

Ajustar contamination

Por fin ha llegado el momento de ajustar el famoso parámetro contamination. Las funciones evaluate_outlier_classifier y evaluate_regressor del vídeo ya están cargadas para ti. Puedes revisarlas abajo.

def evaluate_outlier_classifier(model, data):
    # Get labels
    labels = model.fit_predict(data)

    # Return inliers
    return data[labels == 0]
def evaluate_regressor(inliers):
    X = inliers.drop("price", axis=1)
    y = inliers[['price']]
    X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=10)

    lr = LinearRegression()
    lr.fit(X_train, y_train)

    preds = lr.predict(X_test)
    rmse = root_mean_squared_error(y_test, preds)

    return round(rmse, 3)

Vas a usar una muestra del conjunto de datos US Airbnb Listings, que ya se ha cargado como airbnb_df.

Este ejercicio forma parte del curso

Detección de anomalías en Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create a list of contaminations and an empty dictionary
contaminations = ____
scores = ____
Editar y ejecutar código