1
Clasificación
Gratuito
En este capítulo, se te presentarán los problemas de clasificación y aprenderás a resolverlos mediante técnicas de aprendizaje supervisado. Aprenderás a dividir los datos en conjuntos de entrenamiento y de prueba, ajustar un modelo, hacer predicciones y evaluar la precisión. Descubrirás la relación entre la complejidad del modelo y el rendimiento, aplicando lo que aprendas a un conjunto de datos de rotación, donde clasificarás el estado de rotación de los clientes de una empresa de telecomunicaciones.
2
Regresión
En este capítulo, te introducirás en la regresión y construirás modelos para predecir los valores de las ventas utilizando un conjunto de datos sobre gastos publicitarios. Aprenderás la mecánica de la regresión lineal y las métricas de rendimiento más comunes, como R-cuadrado y error cuadrático medio. Realizarás la validación cruzada k-fold, y aplicarás la regularización a los modelos de regresión para reducir el riesgo de sobreajuste.
3
Afinar tu modelo
Una vez entrenados los modelos, ahora aprenderás a evaluarlos. En este capítulo, se te presentarán varias métricas junto con una técnica de visualización para analizar el rendimiento de los modelos de clasificación mediante scikit-learn. También aprenderás a optimizar los modelos de clasificación y regresión mediante el uso del ajuste de hiperparámetros.
4
Preprocesamiento y canalizaciones
Aprende a imputar valores perdidos, convertir datos categóricos en valores numéricos, escalar datos, evaluar simultáneamente múltiples modelos de aprendizaje supervisado y construir canalizaciones para agilizar tu flujo de trabajo.

Initializing

Ajustar y predecir para la regresión

Ahora que ya has visto cómo funciona la regresión lineal, tu tarea consiste en crear un modelo de regresión lineal múltiple utilizando todas las características del conjunto de datos sales_df, que se ha cargado previamente para ti. Como recordatorio, aquí tienes las dos primeras filas:

     tv        radio      social_media    sales

1    13000.0   9237.76    2409.57         46677.90
2    41000.0   15886.45   2913.41         150177.83

A continuación, utilizarás este modelo para predecir las ventas en función de los valores de las características de prueba.

LinearRegression y train_test_split han sido precargados para ti desde sus respectivos módulos.

Crea X, una matriz que contenga los valores de todas las características de sales_df, y y, que contenga todos los valores de la columna "sales".
Instanciar un modelo de regresión lineal.
Ajusta el modelo a los datos de entrenamiento.
Crea y_pred, haciendo predicciones para sales utilizando las características de prueba.