CommencerCommencer gratuitement

Extraire une fonction

Lors du développement d'un modèle permettant de prédire les diplômes universitaires, vous avez rédigé le code ci-dessous afin d'obtenir les scores z des moyennes générales annuelles des étudiants (les scores z indiquent l'écart type par rapport à la moyenne). Vous êtes désormais prêt à le transformer en un système de qualité production, vous devez donc trouver une solution pour les répétitions. Écrire une fonction pour calculer les scores z permettrait de l'améliorer.

# Standardize the GPAs for each year
df['y1_z'] = (df.y1_gpa - df.y1_gpa.mean()) / df.y1_gpa.std()
df['y2_z'] = (df.y2_gpa - df.y2_gpa.mean()) / df.y2_gpa.std()
df['y3_z'] = (df.y3_gpa - df.y3_gpa.mean()) / df.y3_gpa.std()
df['y4_z'] = (df.y4_gpa - df.y4_gpa.mean()) / df.y4_gpa.std()

Remarque : df est un DataFrame pandas où chaque ligne correspond à un étudiant avec 4 colonnes indiquant les moyennes générales annuelles des étudiants : y1_gpa, y2_gpa, y3_gpa, y4_gpa.

Cet exercice fait partie du cours

Écrire des fonctions en Python

Afficher le cours

Instructions

  • Complétez la fonction afin qu'elle renvoie les scores z d'une colonne.
  • Utilisez la fonction pour calculer les scores z pour chaque année (df['y1_z'], df['y2_z'], etc.) à partir des scores GPA bruts (df.y1_gpa, df.y2_gpa, etc.).

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

def standardize(column):
  """Standardize the values in a column.

  Args:
    column (pandas Series): The data to standardize.

  Returns:
    pandas Series: the values as z-scores
  """
  # Finish the function so that it returns the z-scores
  z_score = (____ - ____.____()) / ____.____()
  return z_score

# Use the standardize() function to calculate the z-scores
df['y1_z'] = ____
df['y2_z'] = ____
df['y3_z'] = ____
df['y4_z'] = ____
Modifier et exécuter le code