Calcul des probabilités
Le cadre de données where9am contient 91 jours (treize semaines) de données dans lesquelles Brett a enregistré son location à 9 heures du matin chaque jour, ainsi que le fait que le daytype était un week-end ou un jour de semaine.
En utilisant la formule de probabilité conditionnelle ci-dessous, vous pouvez calculer la probabilité que Brett travaille au bureau, étant donné que c'est un jour de semaine.
$$ P(A|B) = \frac{P(A \text{ and } B)}{P(B)} $$
Les calculs de ce type constituent la base du modèle de prédiction de destination Naive Bayes que vous développerez dans les exercices suivants.
Cet exercice fait partie du cours
<cours>Apprentissage supervisé en R : Classification</cours>Instructions de l’exercice
- Trouvez P(office) en utilisant
nrow()etsubset()pour compter les lignes dans l'ensemble de données et enregistrez le résultat sousp_A. - Trouvez P(jour de semaine), en utilisant à nouveau
nrow()etsubset(), et enregistrez le résultat sousp_B. - Utilisez
nrow()etsubset()une dernière fois pour trouver P(bureau et jour de semaine). Enregistrez le résultat sousp_AB. - Calculez P(bureau | jour de semaine) et enregistrez le résultat sous
p_A_given_B. - Affichez la valeur de
p_A_given_B.
Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Compute P(A)
p_A <- ___
# Compute P(B)
p_B <- ___
# Compute the observed P(A and B)
p_AB <- ___
# Compute P(A | B) and print its value
p_A_given_B <- ___
___