Bac \backslash Bac Blanc & Moins de la moyenne & Plus de moyenne & Total\\
\hline
Moins de la moyenne & 30 & 300 & 60\\
\hline
Plus de la moyenne & 20 & 70 & 90\\
\hline
Total & 50 & 100 & 150\\
\hline
\end{tabular}
\end{center}
On choisit au hasard un jeune parmi ceux interrogés. On note $A =\left\{\mbox{Plus de la moyenne au bac blanc}\right\}$ et $B =\left\{\mbox{Moins de la moyenne au bac blanc}\right\}$.
Pour chacune des phrases suivantes, justifier si elles sont vraies ou fausses.
\begin{enumerate}
\item La probabilité qu'un élève ait plus de moyenne au bac blanc est supérieur à 30\%.
\item La probabilité qu'il ait la moyenne au bac blanc mais pas au au bac est de moins de 0.1.
\item La probabilité qu'il n'ait pas la moyenne au bac et pas la moyenne au bac blanc est de $\frac{1}{5}$.
\item La probabilité qu'il ait la moyenne au bac blanc ou au bac est de plus de 70\%.
\item La probabilité qu'un élève qui a eu la moyenne au bac blanc ait ensuite la moyenne au bac est de 0.6.
\item La probabilité qu'un élève qui n'a pas eu la moyenne au bac blanc ne l'ait toujours pas au bac est de 50\%.
\end{enumerate}
\end{exercise}
\begin{exercise}[subtitle={Moyen de paiement}, step={1}, origin={Création}, topics={Probabilités conditionnelles}, tags={probabilité, simulation}]
Le gérant d'une grande enseigne de distribution a commandé une étude statistique des moyens de paiement de ses clients. Les résultats ont été représenté dans l'arbre ci-dessous.
\bigskip
\begin{tikzpicture}[sloped]
\node{.}
child {node {Moins de 20\euro}
child {node {Espèce}
edge from parent
node[above] {0.6}
}
child[missing] {}
child {node {Paiement sans contact}
edge from parent
node[above] {0.3}
}
child[missing] {}
child {node {Carte bleu}
edge from parent
node[above] {0.1}
}
edge from parent
node[above] {0.4}
}
child[missing] {}
child[missing] {}
child[missing] {}
child[missing] {}
child[missing] {}
child { node {Plus de 20\euro}
child {node {Espèce}
edge from parent
node[above] {0.4}
}
child[missing] {}
child {node {Paiement sans contact}
edge from parent
node[above] {0.1}
}
child[missing] {}
child {node {Carte bleu}
edge from parent
node[above] {0.5}
}
edge from parent
node[above] {0.6}
} ;
\end{tikzpicture}
\bigskip
On sélectionne un client de cette enseigne au hasard. On note
\[
M = \left\{\mbox{ Moins de 20\euro}\right\}\qquad E = \left\{\mbox{ Espèce }\right\}\qquad B = \left\{\mbox{ carte bleu }\right\}
\]
Pour chacune des phrases suivantes, justifier si elles sont vraies ou fausses.
\begin{enumerate}
\item La probabilité qu'un client achète pour plus de 20\euro est de 0.6.
\item Si l'achat est de moins de 20\euro, il y a une probabilité de 10\% qu'il soit fait en paiement sans contact.
\item Si les achats sont de plus de 20\euro, la probabilité qu'il ait été fait avec de l'espèce est de 0.4.
\item La probabilité qu'un achat soit de plus de 20\euro et payé avec une carte bleu est de 90\%.
\item La probabilité qu'un achat soit de moins de 20\euro et payé avec une carte bleu est de 0.2.
\item La probabilité qu'un achat soit de moins de 20\euro et payé avec de l'espère est de 1.
\item La probabilité ait été payé avec le paiement sans contact est de 72\%.
Le test ADN le plus répandu consiste en l’analyse de micro-sites. Ces régions de l’ADN sont situées dans des parties non codantes, qui varient beaucoup d’un individu à l’autre (on parle de polymorphisme). La forme de chaque micro-site est commune à environ \%5 de la population. Mais la carte complète formée par l’analyse de 11 à 16 micro-sites testés est presque unique, une sorte de « code barre génétique » à ceci près qu’il n’est pas garanti que deux personnes aient forcément des codes barres génétiques différents.
Et c’est là qu’il faut être prudent : tester n’est pas identifier ! Partant de deux échantillons, un test positif donne une probabilité qu’ils proviennent de la même personne. Un test négatif permet d’avoir la certitude que ce n’est pas le cas.
On aboutit ainsi à une sorte de paradoxe assez impressionnant : plus on augmente la taille du fichier, plus on est sûr qu’il contiendra des doublons ! Ce qui veut dire que, même si on arrive à un test très fiable (disons une chance sur quelques millions d’avoir le même profil qu’une autre personne), en fichant tout le monde (en fait quelques dizaines milliers suffisent) on est sûr d’avoir des doublons.
En matière de justice, le test ADN est avant tout une confirmation (ou une infirmation) d’une enquête déjà menée, et non un moyen de trouver des coupables. Ficher tout le monde, outre les problèmes éthiques que cela pose, serait avant tout une porte ouverte à l’arbitraire et à l’injustice.
En France, le Fichier national automatisé des empreintes génétiques (FNAEG), mis en œuvre par le ministère de l'Intérieur français sous le contrôle du ministère de la Justice, gère les empreintes génétiques utiles à la résolution d'enquêtes visant les criminels, les délinquants mais pas les contrevenants. Il est déclaré à la Commission nationale de l'informatique et des libertés.
Nombre de profils en 2018: \np{3 480 000}.
\textit{Source: Wikipedia - Fichier national automatisé des empreintes génétiques}
\end{doc}
\vspace{-0.5cm}
On cherche à comprendre le sens du dernier paragraphe du document 1. Pour cela, on réalise un prélèvement ADN sur le lieu d'un crime et on suppose que le criminel est déjà enregistré dans le fichier FNAEG.
\begin{enumerate}
\item Quelle est la probabilité \textbf{a priori} qu'un profil pris au hasard soit bien celui du criminel?
\item D'après le document 1, déterminer la sensibilité et la spécificité du test ADN présenté.
\item On sélectionne un profil au hasard dans le fichier. Le test est positif, quel est la probabilité qu'il soit le criminel?
\item Commenter le dernier paragraphe du document 1 au vu des calculs que vous avez réalisés.
\end{enumerate}
\end{exercise}
\begin{exercise}[subtitle={Sophisme du procureur}, step={2}, origin={Création}, topics={Probabilités conditionnelles}, tags={probabilité, simulation}]
\setcounter{doc}{0}
\begin{doc}{Sally Clark}
Sally Clark (née en août 1964 et morte le 15 mars 2007) est une avocate anglaise qui fut victime d'une erreur judiciaire. Elle fut accusée d'avoir tué ses deux nourrissons sur la base entre autres d'une mauvaise utilisation de la statistique.
Le procès se base sur un diagnostic de syndrome de Münchhausen par procuration par le pédiatre Roy Meadow, fondé sur une démarche statistique incorrecte. Il prétend en effet que les chances que deux enfants d'une famille riche subissent une mort subite du nourrisson sont d'une pour 73 millions (résultat auquel il arrive en se basant sur un chiffre tirée d'une étude qui affirme la probabilité qu'une famille aisée non-fumeuse dont la mère est âgée de plus de 26 ans fasse face à la mort de leur bébé soit de 1 sur \np{8500}.).
\textit{Source: Wikipedia - Sally Clark}
\end{doc}
\vspace{-0.7cm}
\begin{doc}{Sophisme du Procureur}
Sally Clark fut condamnée pour meurtre en 1999, suite à quoi la Royal Statistical Society publia un communiqué mettant en évidence les erreurs statistiques du raisonnement. En 2004, Ray Hill, un professeur de mathématiques de l'Université de Salford publia un article estimant les probabilités de chacune des hypothèses4, concluant que l'hypothèse du double accident était entre 4,5 et 9 fois plus probable que celle du double meurtre.
On découvrit que les rapports d'autopsie des deux enfants avaient ignoré des éléments à décharge, et une cour d'appel invalida le jugement et innocenta Sally Clark le 29 janvier 20035. Malheureusement, les trois années que Sally Clark passa injustement en prison causèrent chez elle de nombreux troubles psychiatriques, en particulier l'alcoolisme, ce qui causa sa mort en 2007.
\textit{Source: Wikipedia - Sophisme du Procureur}
\end{doc}
\vspace{-0.7cm}
\begin{enumerate}
\item Expliquer comment le pédiatre arrive au chiffre de 1 sur 73 milions. Pourquoi ce chiffre est critiquable?
\item Le nombre annoncé par la Royal Statistical Society est qu'il y a a priori une chance sur 500 milions qu'un double infanticide arrive en Angleterre. Estimer d'après les nombres donnés dans l'exercice, la probabilité que, sachant que Sally Clark ait vu ses 2 enfants mourir, elle soit coupable de double infanticide.