2020-2021/Complementaire/02_Inference_Baysienne/exercises.tex

287 lines
17 KiB
TeX
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

\collectexercises{banque}
\begin{exercise}[subtitle={Vrai-Faux}, step={1}, origin={Création}, topics={Probabilités conditionnelles}, tags={probabilité, simulation}]
Dans le tableau ci-dessous, on a trier les élèves en fonction de leur note au bac et au bac blanc.
\begin{center}
\begin{tabular}{|>{\columncolor{highlightbg}}c|*{2}{p{4cm}|}|p{4cm}|}
\hline
\rowcolor{highlightbg}
Bac \backslash Bac Blanc & Moins de la moyenne & Plus de moyenne & Total\\
\hline
Moins de la moyenne & 30 & 300 & 60\\
\hline
Plus de la moyenne & 20 & 70 & 90\\
\hline
Total & 50 & 100 & 150\\
\hline
\end{tabular}
\end{center}
On choisit au hasard un jeune parmi ceux interrogés. On note $A = \left\{ \mbox{Plus de la moyenne au bac blanc} \right\}$ et $B = \left\{ \mbox{Moins de la moyenne au bac blanc} \right\}$.
Pour chacune des phrases suivantes, justifier si elles sont vraies ou fausses.
\begin{enumerate}
\item La probabilité qu'un élève ait plus de moyenne au bac blanc est supérieur à 30\%.
\item La probabilité qu'il ait la moyenne au bac blanc mais pas au au bac est de moins de 0.1.
\item La probabilité qu'il n'ait pas la moyenne au bac et pas la moyenne au bac blanc est de $\frac{1}{5}$.
\item La probabilité qu'il ait la moyenne au bac blanc ou au bac est de plus de 70\%.
\item La probabilité qu'un élève qui a eu la moyenne au bac blanc ait ensuite la moyenne au bac est de 0.6.
\item La probabilité qu'un élève qui n'a pas eu la moyenne au bac blanc ne l'ait toujours pas au bac est de 50\%.
\end{enumerate}
\end{exercise}
\begin{exercise}[subtitle={Moyen de paiement}, step={1}, origin={Création}, topics={Probabilités conditionnelles}, tags={probabilité, simulation}]
Le gérant d'une grande enseigne de distribution a commandé une étude statistique des moyens de paiement de ses clients. Les résultats ont été représenté dans l'arbre ci-dessous.
\bigskip
\begin{tikzpicture}[sloped]
\node {.}
child {node {Moins de 20\euro}
child {node {Espèce}
edge from parent
node[above] {0.6}
}
child[missing] {}
child {node {Paiement sans contact}
edge from parent
node[above] {0.3}
}
child[missing] {}
child {node {Carte bleu}
edge from parent
node[above] {0.1}
}
edge from parent
node[above] {0.4}
}
child[missing] {}
child[missing] {}
child[missing] {}
child[missing] {}
child[missing] {}
child { node {Plus de 20\euro}
child {node {Espèce}
edge from parent
node[above] {0.4}
}
child[missing] {}
child {node {Paiement sans contact}
edge from parent
node[above] {0.1}
}
child[missing] {}
child {node {Carte bleu}
edge from parent
node[above] {0.5}
}
edge from parent
node[above] {0.6}
} ;
\end{tikzpicture}
\bigskip
On sélectionne un client de cette enseigne au hasard. On note
\[
M = \left\{ \mbox{ Moins de 20\euro } \right\} \qquad E = \left\{ \mbox{ Espèce }\right\} \qquad B = \left\{ \mbox{ carte bleu }\right\}
\]
Pour chacune des phrases suivantes, justifier si elles sont vraies ou fausses.
\begin{enumerate}
\item La probabilité qu'un client achète pour plus de 20\euro est de 0.6.
\item Si l'achat est de moins de 20\euro, il y a une probabilité de 10\% qu'il soit fait en paiement sans contact.
\item Si les achats sont de plus de 20\euro, la probabilité qu'il ait été fait avec de l'espèce est de 0.4.
\item La probabilité qu'un achat soit de plus de 20\euro et payé avec une carte bleu est de 90\%.
\item La probabilité qu'un achat soit de moins de 20\euro et payé avec une carte bleu est de 0.2.
\item La probabilité qu'un achat soit de moins de 20\euro et payé avec de l'espère est de 1.
\item La probabilité ait été payé avec le paiement sans contact est de 72\%.
\end{enumerate}
\end{exercise}
\begin{exercise}[subtitle={Tests ADN}, step={2}, origin={Création}, topics={Probabilités conditionnelles}, tags={probabilité, simulation}]
\begin{doc}{Tests ADN}
Le test ADN le plus répandu consiste en lanalyse de micro-sites. Ces régions de lADN sont situées dans des parties non codantes, qui varient beaucoup dun individu à lautre (on parle de polymorphisme). La forme de chaque micro-site est commune à environ \%5 de la population. Mais la carte complète formée par lanalyse de 11 à 16 micro-sites testés est presque unique, une sorte de « code barre génétique » à ceci près quil nest pas garanti que deux personnes aient forcément des codes barres génétiques différents.
Et cest là quil faut être prudent : tester nest pas identifier ! Partant de deux échantillons, un test positif donne une probabilité quils proviennent de la même personne. Un test négatif permet davoir la certitude que ce nest pas le cas.
On aboutit ainsi à une sorte de paradoxe assez impressionnant : plus on augmente la taille du fichier, plus on est sûr quil contiendra des doublons ! Ce qui veut dire que, même si on arrive à un test très fiable (disons une chance sur quelques millions davoir le même profil quune autre personne), en fichant tout le monde (en fait quelques dizaines milliers suffisent) on est sûr davoir des doublons.
En matière de justice, le test ADN est avant tout une confirmation (ou une infirmation) dune enquête déjà menée, et non un moyen de trouver des coupables. Ficher tout le monde, outre les problèmes éthiques que cela pose, serait avant tout une porte ouverte à larbitraire et à linjustice.
\textit{Source: } \url{http://images.math.cnrs.fr/Coincidences.html?lang=fr}
\end{doc}
\vspace{-0.7cm}
\begin{doc}{Fichier FNAEG}
En France, le Fichier national automatisé des empreintes génétiques (FNAEG), mis en œuvre par le ministère de l'Intérieur français sous le contrôle du ministère de la Justice, gère les empreintes génétiques utiles à la résolution d'enquêtes visant les criminels, les délinquants mais pas les contrevenants. Il est déclaré à la Commission nationale de l'informatique et des libertés.
Nombre de profils en 2018: \np{3 480 000}.
\textit{Source: Wikipedia - Fichier national automatisé des empreintes génétiques}
\end{doc}
\vspace{-0.5cm}
On cherche à comprendre le sens du dernier paragraphe du document 1. Pour cela, on réalise un prélèvement ADN sur le lieu d'un crime et on suppose que le criminel est déjà enregistré dans le fichier FNAEG.
\begin{enumerate}
\item Quelle est la probabilité \textbf{a priori} qu'un profil pris au hasard soit bien celui du criminel?
\item D'après le document 1, déterminer la sensibilité et la spécificité du test ADN présenté.
\item On sélectionne un profil au hasard dans le fichier. Le test est positif, quel est la probabilité qu'il soit le criminel?
\item Commenter le dernier paragraphe du document 1 au vu des calculs que vous avez réalisés.
\end{enumerate}
\end{exercise}
\begin{exercise}[subtitle={Sophisme du procureur}, step={2}, origin={Création}, topics={Probabilités conditionnelles}, tags={probabilité, simulation}]
\setcounter{doc}{0}
\begin{doc}{Sally Clark}
Sally Clark (née en août 1964 et morte le 15 mars 2007) est une avocate anglaise qui fut victime d'une erreur judiciaire. Elle fut accusée d'avoir tué ses deux nourrissons sur la base entre autres d'une mauvaise utilisation de la statistique.
Le procès se base sur un diagnostic de syndrome de Münchhausen par procuration par le pédiatre Roy Meadow, fondé sur une démarche statistique incorrecte. Il prétend en effet que les chances que deux enfants d'une famille riche subissent une mort subite du nourrisson sont d'une pour 73 millions (résultat auquel il arrive en se basant sur un chiffre tirée d'une étude qui affirme la probabilité qu'une famille aisée non-fumeuse dont la mère est âgée de plus de 26 ans fasse face à la mort de leur bébé soit de 1 sur \np{8500}.).
\textit{Source: Wikipedia - Sally Clark}
\end{doc}
\vspace{-0.7cm}
\begin{doc}{Sophisme du Procureur}
Sally Clark fut condamnée pour meurtre en 1999, suite à quoi la Royal Statistical Society publia un communiqué mettant en évidence les erreurs statistiques du raisonnement. En 2004, Ray Hill, un professeur de mathématiques de l'Université de Salford publia un article estimant les probabilités de chacune des hypothèses4, concluant que l'hypothèse du double accident était entre 4,5 et 9 fois plus probable que celle du double meurtre.
On découvrit que les rapports d'autopsie des deux enfants avaient ignoré des éléments à décharge, et une cour d'appel invalida le jugement et innocenta Sally Clark le 29 janvier 20035. Malheureusement, les trois années que Sally Clark passa injustement en prison causèrent chez elle de nombreux troubles psychiatriques, en particulier l'alcoolisme, ce qui causa sa mort en 2007.
\textit{Source: Wikipedia - Sophisme du Procureur}
\end{doc}
\vspace{-0.7cm}
\begin{enumerate}
\item Expliquer comment le pédiatre arrive au chiffre de 1 sur 73 milions. Pourquoi ce chiffre est critiquable?
\item Le nombre annoncé par la Royal Statistical Society est qu'il y a a priori une chance sur 500 milions qu'un double infanticide arrive en Angleterre. Estimer d'après les nombres donnés dans l'exercice, la probabilité que, sachant que Sally Clark ait vu ses 2 enfants mourir, elle soit coupable de double infanticide.
\end{enumerate}
Explication vidéo \url{https://peertube.noussommes.org/videos/watch/playlist/cf21ffd6-9b0d-4339-9c22-db71afbf8d4d?playlistPosition=29}
\end{exercise}
\begin{exercise}[subtitle={Aéroport}, step={5}, origin={Création}, topics={Probabilités conditionnelles}, tags={probabilité, simulation}]
Dans un aéroport, les portiques de sécurité servent à détecter les objets métalliques que peuvent emporter les voyageurs.
On choisit au hasard un voyageur franchissant un portique.
\begin{itemize}
\item $S$ l'événement \og le voyageur fait sonner le portique \fg{};
\item $M$ l'événement \og le voyageur porte un objet métallique \fg{}.
\end{itemize}
On considère qu'un voyageur sur 500 porte sur lui un objet métallique. Et on note que
\begin{itemize}
\item Lorsqu'un voyageur franchit le portique avec un objet métallique, la probabilité que le portique sonne est égale à $0,98$;
\item Lorsqu'un voyageur franchit le portique sans objet métallique, la probabilité que le portique ne sonne pas est aussi égale à $0,98$.
\end{itemize}
\begin{minipage}{0.6\textwidth}
\begin{enumerate}
\item À l'aide des données de l'énoncé, préciser les valeurs de $P(M)$, $P_{M}(S)$ et $P_{\overline{M}}(\overline{S})$.
\item Recopier et compléter l'arbre pondéré ci-contre illustrant cette situation.
\item Montrer que: $P(S)=\np{0,02192}$.
\item En déduire la probabilité qu'un voyageur porte un objet métallique sachant qu'il a fait sonner le portique. (On arrondira le résultat à $10^{-3}$.)
\end{enumerate}
\end{minipage}
\hfill
\begin{minipage}{0.3\textwidth}
\begin{tikzpicture}[sloped]
\node {.}
child {node {$M$}
child {node {$S$}
edge from parent
node[above] {...}
}
child {node {$\overline{S}$}
edge from parent
node[above] {...}
}
edge from parent
node[above] {...}
}
child[missing] {}
child { node {$\overline{M}$}
child {node {$S$}
edge from parent
node[above] {...}
}
child {node {$\overline{S}$}
edge from parent
node[above] {...}
}
edge from parent
node[above] {...}
} ;
\end{tikzpicture}
\end{minipage}
\end{exercise}
\begin{exercise}[subtitle={Sponsort}, step={5}, origin={Création}, topics={Probabilités conditionnelles}, tags={probabilité, simulation}]
Un navigateur s'entraîne régulièrement dans le but de battre le record du monde de
traversée de l'Atlantique à la voile.
\emph{Dans cet exercice, les résultats seront arrondis au millième si nécessaire.}
Une entreprise nommée \og Régate \fg, s'intéresse aux résultats de ce navigateur.
La probabilité qu'il réalise la traversée en moins de 6 jours est de 0,16.
Si le navigateur réalise la traversée en moins de 6 jours, l'entreprise le sponsorise avec une probabilité de 0,95.
Sinon, l'entreprise hésite et le sponsorise avec une probabilité de 0,50.
On note $M$ l'évènement \og la traversée est réalisée par le navigateur en moins de 6 jours \fg et $F$ l'évènement \og l'entreprise sponsorise le navigateur \fg.
\begin{enumerate}
\item Représenter cette situation à l'aide d'un arbre pondéré.
\item Montrer que la probabilité que l'entreprise ne sponsorise pas le navigateur à la
prochaine course est $0,428$.
\item L'entreprise a finalement choisi de ne pas financer le navigateur.
Calculer la probabilité que le navigateur ait tout de même réalisé la traversée en moins
de $6$ jours.
\end{enumerate}
\end{exercise}
\begin{exercise}[subtitle={Paiements}, step={5}, origin={Création}, topics={Probabilités conditionnelles}, tags={probabilité, simulation}]
Un commerçant dispose dans sa boutique d'un terminal qui permet à ses clients, s'ils souhaitent
régler leurs achats par carte bancaire, d'utiliser celle-ci en mode sans contact (quand le montant de
la transaction est inférieur ou égal à 30~\euro) ou bien en mode code secret (quel que soit le montant
de la transaction).
Il remarque que 80\,\% de ses clients règlent des sommes inférieures ou égales à 30~\euro. Parmi eux :
\begin{itemize}
\item 40\,\% paient en espèces;
\item 40\,\% paient avec une carte bancaire en mode sans contact ;
\item les autres paient avec une carte bancaire en mode code secret.
\end{itemize}
Et que 20\,\% de ses clients règlent des sommes strictement supérieures à 30~\euro. Parmi eux :
\begin{itemize}
\item 70\,\% paient avec une carte bancaire en mode code secret ;
\item les autres paient en espèces.
\end{itemize}
On interroge au hasard un client qui vient de régler un achat dans la boutique.
On considère les évènements suivants :
$V$ : \og le client a réglé un montant inférieur ou égal à 30~\euro \fg ;
$E$ : \og le client a réglé en espèces\fg ;
$C$ : \og le client a réglé avec sa carte bancaire en mode code secret\fg ;
$S$ : \og le client a réglé avec sa carte bancaire en mode sans contact \fg.
\medskip
\begin{enumerate}
\item
\begin{enumerate}
\item Donner la probabilité de l'évènement $V$, notée $P(V)$, ainsi que la probabilité de $S$ sachant
$V$ notée $P_V(S)$.
\item Traduire la situation de l'énoncé à l'aide d'un arbre pondéré.
\end{enumerate}
\item
\begin{enumerate}
\item Calculer la probabilité que pour son achat, le client ait réglé un montant inférieur ou égal à $30$~\euro{} et qu'il ait utilisé sa carte bancaire en mode sans contact.
\item Montrer que la probabilité de l'évènement: \og pour son achat, le client a réglé avec sa carte
bancaire en utilisant l'un des deux modes\fg{} est égale à $0,62$.
\end{enumerate}
\end{enumerate}
\end{exercise}
\collectexercisesstop{banque}