CommencerCommencer gratuitement

Normalisation logarithmique

La standardisation est importante pour que toutes les features soient comparables. La normalisation logarithmique est une méthode courante de standardisation. Vous allez vérifier la variance de certaines features et calculer la variance médiane globale parmi les features. Les features seront les colonnes numériques, à l’exception des colonnes click, banner_pos, device_type, ainsi que search_engine_type, product_type et advertiser_type de la leçon précédente, car ce sont en réalité des colonnes catégorielles. Vous appliquerez ensuite une normalisation logarithmique aux colonnes dont la variance est supérieure à la variance médiane et vous vérifierez les résultats.

Le module pandas est disponible sous le nom pd dans votre espace de travail et le DataFrame d’exemple est chargé dans df.

Cet exercice fait partie du cours

Prédire le CTR avec le Machine Learning en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Select numeric columns and print variance
num_df = df.____(include=['int', 'float'])
filter_cols = ['click', 'banner_pos', 'device_type',
               'search_engine_type', 'product_type', 'advertiser_type']
new_df = num_df[num_df.columns[~num_df.columns.____(filter_cols)]]
median = new_df.____.____
print(median)
Modifier et exécuter le code