Vers l’approximation par grille
Félicitations ! Vous venez d’être embauché·e comme data analyst au ministère de la Santé. Le gouvernement envisage d’acheter un tout nouveau médicament contre un virus mortel et contagieux. Des doutes subsistent toutefois quant à l’efficacité réelle de ce médicament. Votre mission est d’estimer son taux d’efficacité, c’est‑à‑dire le pourcentage de patient·es guéri·es grâce au traitement.
Une expérience a été mise en place rapidement : 10 patient·es malades ont été traité·es avec le médicament. Une fois que vous saurez combien d’entre eux·elles sont guéri·es, vous pourrez utiliser la loi binomiale en considérant qu’un·e patient·e guéri·e est un « succès » et que le taux d’efficacité est la « probabilité de succès ». En attendant les résultats de l’expérience, vous décidez de préparer la grille de paramètres.
numpy et pandas ont été importés pour vous sous les alias np et pd.
Cet exercice fait partie du cours
Analyse de données bayésienne en Python
Instructions
- À l’aide de
np.arange(), créez un tableau de toutes les valeurs possibles pour le nombre de patient·es guéri·es (de 0 à 10) et affectez‑le ànum_patients_cured. - À l’aide de
np.arange(), créez un tableau de toutes les valeurs possibles pour le taux d’efficacité (de 0 à 1, par pas de 0,01) et affectez‑le àefficacy_rate. - Combinez
num_patients_curedetefficacy_ratedans un DataFrame appelédf, en listant toutes les combinaisons possibles des deux. - Affectez
["num_patients_cured", "efficacy_rate"]aux colonnes dedfet affichez‑le.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create cured patients array from 1 to 10
num_patients_cured = ____
# Create efficacy rate array from 0 to 1 by 0.01
efficacy_rate = ____
# Combine the two arrays in one DataFrame
df = ____([(x, y) for x in ____ for y in ____])
# Name the columns
df.columns = ____
# Print df
print(df)