Feat: 3E sur l'inférence Bayésienne
All checks were successful
continuous-integration/drone/push Build is passing

This commit is contained in:
Bertrand Benjamin 2021-03-23 12:33:16 +01:00
parent 7b6f90a7ba
commit fa598939a8
4 changed files with 83 additions and 2 deletions

View File

@ -0,0 +1,21 @@
\documentclass[a4paper,10pt]{article}
\usepackage{myXsim}
\author{Benjamin Bertrand}
\title{Probabilités conditionnelles - Exercice}
\date{Mars 2021}
\pagestyle{empty}
\DeclareExerciseCollection{banque}
\xsimsetup{
step=2,
}
\begin{document}
\input{exercises.tex}
\printcollection{banque}
\vfill
\end{document}

View File

@ -95,4 +95,60 @@
\item La probabilité ait été payé avec le paiement sans contact est de 72\%.
\end{enumerate}
\end{exercise}
\begin{exercise}[subtitle={Tests ADN}, step={2}, origin={Création}, topics={Probabilités conditionnelles}, tags={probabilité, simulation}]
\begin{doc}{Tests ADN}
Le test ADN le plus répandu consiste en lanalyse de micro-sites. Ces régions de lADN sont situées dans des parties non codantes, qui varient beaucoup dun individu à lautre (on parle de polymorphisme). La forme de chaque micro-site est commune à environ \%5 de la population. Mais la carte complète formée par lanalyse de 11 à 16 micro-sites testés est presque unique, une sorte de « code barre génétique » à ceci près quil nest pas garanti que deux personnes aient forcément des codes barres génétiques différents.
Et cest là quil faut être prudent : tester nest pas identifier ! Partant de deux échantillons, un test positif donne une probabilité quils proviennent de la même personne. Un test négatif permet davoir la certitude que ce nest pas le cas.
On aboutit ainsi à une sorte de paradoxe assez impressionnant : plus on augmente la taille du fichier, plus on est sûr quil contiendra des doublons ! Ce qui veut dire que, même si on arrive à un test très fiable (disons une chance sur quelques millions davoir le même profil quune autre personne), en fichant tout le monde (en fait quelques dizaines milliers suffisent) on est sûr davoir des doublons.
En matière de justice, le test ADN est avant tout une confirmation (ou une infirmation) dune enquête déjà menée, et non un moyen de trouver des coupables. Ficher tout le monde, outre les problèmes éthiques que cela pose, serait avant tout une porte ouverte à larbitraire et à linjustice.
\textit{Source: } \url{http://images.math.cnrs.fr/Coincidences.html?lang=fr}
\end{doc}
\vspace{-0.7cm}
\begin{doc}{Fichier FNAEG}
En France, le Fichier national automatisé des empreintes génétiques (FNAEG), mis en œuvre par le ministère de l'Intérieur français sous le contrôle du ministère de la Justice, gère les empreintes génétiques utiles à la résolution d'enquêtes visant les criminels, les délinquants mais pas les contrevenants. Il est déclaré à la Commission nationale de l'informatique et des libertés.
Nombre de profils en 2018: \np{3 480 000}.
\textit{Source: Wikipedia - Fichier national automatisé des empreintes génétiques}
\end{doc}
\vspace{-0.5cm}
On cherche à comprendre le sens du dernier paragraphe du document 1. Pour cela, on réalise un prélèvement ADN sur le lieu d'un crime et on suppose que le criminel est déjà enregistré dans le fichier FNAEG.
\begin{enumerate}
\item Quelle est la probabilité \textbf{a priori} qu'un profil pris au hasard soit bien celui du criminel?
\item D'après le document 1, déterminer la sensibilité et la spécificité du test ADN présenté.
\item On sélectionne un profil au hasard dans le fichier. Le test est positif, quel est la probabilité qu'il soit le criminel?
\item Commenter le dernier paragraphe du document 1 au vu des calculs que vous avez réalisés.
\end{enumerate}
\end{exercise}
\begin{exercise}[subtitle={Sophisme du procureur}, step={2}, origin={Création}, topics={Probabilités conditionnelles}, tags={probabilité, simulation}]
\setcounter{doc}{0}
\begin{doc}{Sally Clark}
Sally Clark (née en août 1964 et morte le 15 mars 2007) est une avocate anglaise qui fut victime d'une erreur judiciaire. Elle fut accusée d'avoir tué ses deux nourrissons sur la base entre autres d'une mauvaise utilisation de la statistique.
Le procès se base sur un diagnostic de syndrome de Münchhausen par procuration par le pédiatre Roy Meadow, fondé sur une démarche statistique incorrecte. Il prétend en effet que les chances que deux enfants d'une famille riche subissent une mort subite du nourrisson sont d'une pour 73 millions (résultat auquel il arrive en se basant sur un chiffre tirée d'une étude qui affirme la probabilité qu'une famille aisée non-fumeuse dont la mère est âgée de plus de 26 ans fasse face à la mort de leur bébé soit de 1 sur \np{8500}.).
\textit{Source: Wikipedia - Sally Clark}
\end{doc}
\vspace{-0.7cm}
\begin{doc}{Sophisme du Procureur}
Sally Clark fut condamnée pour meurtre en 1999, suite à quoi la Royal Statistical Society publia un communiqué mettant en évidence les erreurs statistiques du raisonnement. En 2004, Ray Hill, un professeur de mathématiques de l'Université de Salford publia un article estimant les probabilités de chacune des hypothèses4, concluant que l'hypothèse du double accident était entre 4,5 et 9 fois plus probable que celle du double meurtre.
On découvrit que les rapports d'autopsie des deux enfants avaient ignoré des éléments à décharge, et une cour d'appel invalida le jugement et innocenta Sally Clark le 29 janvier 20035. Malheureusement, les trois années que Sally Clark passa injustement en prison causèrent chez elle de nombreux troubles psychiatriques, en particulier l'alcoolisme, ce qui causa sa mort en 2007.
\textit{Source: Wikipedia - Sophisme du Procureur}
\end{doc}
\vspace{-0.7cm}
\begin{enumerate}
\item Expliquer comment le pédiatre arrive au chiffre de 1 sur 73 milions. Pourquoi ce chiffre est critiquable?
\item Le nombre annoncé par la Royal Statistical Society est qu'il y a a priori une chance sur 500 milions qu'un double infanticide arrive en Angleterre. Estimer d'après les nombres donnés dans l'exercice, la probabilité que, sachant que Sally Clark ait vu ses 2 enfants mourir, elle soit coupable de double infanticide.
\end{enumerate}
Explication vidéo \url{https://peertube.noussommes.org/videos/watch/playlist/cf21ffd6-9b0d-4339-9c22-db71afbf8d4d?playlistPosition=29}
\end{exercise}
\collectexercisesstop{banque}

View File

@ -2,7 +2,7 @@ Inférence Bayésienne
####################
:date: 2021-03-15
:modified: 2021-03-16
:modified: 2021-03-23
:authors: Benjamin Bertrand
:tags: Probabilité, Bayes
:category: Complementaire
@ -45,7 +45,11 @@ Bilan: Reprise d'un exemple traité et vocabulaire associé aux tests. On repren
Étape 3: Application aux tests ADN
==================================
Travail similaire sur les tests ADN
Utilisation des probabilités conditionnelles pour comprendre les tests ADN et le sophisme du procureur.
.. image:: ./3E_ADN_Sophisme.pdf
:height: 200px
:alt: Description
Bilan: Formule de Bayes