ComenzarEmpieza gratis

Creación de nuevas características

El feature engineering también incluye la creación de nuevas características. Crear nuevas características es importante porque el modelo se apoya en ellas para mejorar la precisión de la predicción. En este ejercicio, revisarás propiedades de tres columnas que aparecen como enteros en los datos pero representan valores categóricos. Estas tres columnas son: search_engine_type, product_type y advertiser_type. Crearás características de conteo para esas 3 columnas, así como para device_id y site_id. Estas características de conteo representan el número de clics para cada una de esas columnas y se utilizarán más adelante para la predicción.

El módulo pandas está disponible como pd en tu espacio de trabajo y el DataFrame de ejemplo está cargado como df.

Este ejercicio forma parte del curso

Predicción del CTR con Machine Learning en Python

Ver curso

Instrucciones del ejercicio

  • Imprime el número total de valores y el número de valores únicos para cada característica de la lista feature_list.
  • Crea nuevas características a partir de las de new_feature_list contando el número de clics para cada característica usando .transform().

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Get counts of total and unique values for given features
feature_list = ["search_engine_type", "product_type", "advertiser_type"]
for feature in feature_list:
	print(df[feature].____)
	print(df[feature].____)

# Define new features as counts
new_feature_list = ['device_id', 'site_id'] + feature_list
for new_feature in new_feature_list:
  df[new_feature + '_count'] = df.____(
    new_feature)['click'].____("count")
print(df.head(5))
Editar y ejecutar código