Feat(2nd): cours et début des exercices
continuous-integration/drone/push Build is passing Details

This commit is contained in:
Bertrand Benjamin 2023-02-19 12:13:15 +01:00
parent b050a902de
commit c7e8dae4fd
7 changed files with 345 additions and 0 deletions

Binary file not shown.

View File

@ -0,0 +1,83 @@
\documentclass[a4paper,10pt]{article}
\usepackage{myXsim}
\usepackage{pgfplots}
\pgfplotsset{compat=1.18}
\author{Benjamin Bertrand}
\title{Indicateurs statistiques - Cours}
\date{février 2023}
\pagestyle{empty}
\begin{document}
\maketitle
\section{Description d'une série statistique}
\begin{definition}[Description]
Une série statistique peut se décrire suivant les 3 éléments suivants
\begin{itemize}
\item \textbf{La population}: l'ensemble complet de toutes les observations possibles qui ont été faites.
\item \textbf{Les individus}: les membres qui composent cette population.
\item \textbf{Le caractère étudié}: ce qui est mesurée ou observée dans chaque individu de la population.
\end{itemize}
\end{definition}
\paragraph{Remarque:} Il est important de bien définir la population, les individus et le caractère étudié lors de la collecte de données statistiques, car cela permet de garantir que les résultats obtenus sont précis et applicables à la population étudiée.
\begin{definition}[Effectif]
\noindent
\textbf{L'effectif} d'un ensemble est le nombre d'éléments dans cet ensemble.
\textbf{L'effectif total} d'une population est le nombre d'individus dans cette population.
\end{definition}
\section{Indicateurs de tendance centrale}
Ces indicateurs vont chercher à décrire le "centre" de la série statistique. Autour de quels valeurs toutes les autres gravitent.
\begin{definition}[La médiane]
La \textbf{médiane}, noté \textbf{Me}, est la plus petite valeur de la série pour laquelle \textbf{la moitié} (50\%) des valeurs lui sont inférieurs ou égales.
\end{definition}
\begin{definition}[La moyenne]
La \textbf{moyenne} est la valeur typique d'une série de donnée. On la note $\overline{x}$ et elle se calcule en faisant la somme des valeurs divisé par l'effectif.
\[
\overline{x} = \frac{x_1 + x_2 + ... + x_N}{N}
\]
\end{definition}
\begin{definition}[La moyenne pondérée]
Lorsque l'on souhaite donner plus de poids à certaines valeurs qu'à d'autres, on peut attribuer des poids différents à chaque valeur (coefficients, effectif...).
La moyenne prenant compte de ces poids est une \textbf{moyenne pondérée} et en notant les poids $c_i$ et les valeurs $x_i$ on a
\[
\overline{x} = \frac{x_1\times c_1 + x_2\times c_2 + ... + x_N\times c_N}{c_1 + c_2 + ... + x_N}
\]
\end{definition}
\paragraph{Remarque}: La médiane est moins sensible aux valeurs extrêmes que la moyenne. C'est à dire que si quelques données sont "anormale", la valeur de la médiane sera moins impactée que la moyenne.
\section{Indicateur de dispersion}
Ces indicateurs vont chercher à décrire l'étalement des valeurs.
\begin{definition}[Les quartiles]
\begin{itemize}
\item Le premier quartile, noté \textbf{Q1}, est la plus petite valeur telle que \textbf{un quart} des valeur lui sont inférieurs ou égale.
\item Le troisième quartile, noté \textbf{Q3}, est la plus petite valeur telle que \textbf{trois quart} des valeur lui sont inférieurs ou égale.
\item \textbf{L'écart interquartile} est la différence entre Q1 et Q3: \textbf{Q3 - Q1}
\end{itemize}
\end{definition}
\begin{definition}[L'écart-type]
\textbf{L'écart type}, noté $\sigma$, est la mesure de l'écart entre les valeurs et la moyenne. En notant, $x_i$ les valeurs, on la calcule avec la formule suivante:
\[
\sigma = \sqrt{\frac{(x_1 - \overline{x})^2 +(x_2 - \overline{x})^2 + ... + (x_N - \overline{x})^2 }{N}}
\]
\end{definition}
\end{document}

View File

@ -0,0 +1,132 @@
\begin{exercise}[subtitle={Notation}, step={1}, origin={<++>}, topics={ Indicateurs statistiques }, tags={ Statistiques, Python }, mode={\trainMode}]
On a demandé à des clients dune pizzeria de donner une note à leur pizza entre 0 (“Pas terrible”) et 5 (“Excellente”). Les résultats ci-dessous ont été recueillis pour deux pizzas du menu.
\begin{center}
\begin{tabular}{|*{5}{p{1cm}|}}
\hline
\multicolumn{5}{|c|}{Margarita} \\
\hline
5 & 3 & 4 & 5 & 5\\
\hline
4 & 4 & 1 & 4 & 3 \\
\hline
3 & 2 & 4 & 3 & 1 \\
\hline
\end{tabular}
\begin{tabular}{|*{4}{p{1cm}|}}
\hline
\multicolumn{4}{|c|}{Quatre fromage} \\
\hline
5 & 3 & 4 & 5\\
\hline
1 & 1 & 1 & 3 \\
\hline
3 & 2 & 1 & 1 \\
\hline
\end{tabular}
\end{center}
\begin{enumerate}
\item Décrire chacune de ces séries statistiques.
\item Pour chaque type de pizza, calculer les indicateurs suivants
\begin{tasks}(4)
\task La moyenne $\overline{x}$
\task La médiane $Me$
\task Le premier quartile $Q1$
\task Le troisième quartile $Q3$
\end{tasks}
\item Que peut-on conclure de cette étude ? Vous devrez utiliser les valeurs calculées pour répondre.
\end{enumerate}
\end{exercise}
\begin{exercise}[subtitle={Handballeuses}, step={1}, origin={<++>}, topics={ Indicateurs statistiques }, tags={ Statistiques, Python }, mode={\searchMode}]
La sélectionneuse dune équipe de handball compare le nombre de tirs effectués par deux attaquantes lors de chaque match de la première moitié du championnat.
\begin{itemize}
\item Matchs de Grâce: 20, 0, 16, 4, 12, 8, 10, 10, 11, 9, 14, 6, 18, 2, 20
\item Matchs de Allison: 20, 17, 20, 2, 20, 18, 20, 0, 20, 3, 20, 0, 20, 0, 20
\end{itemize}
\begin{enumerate}
\item Décrire la série statistique.
\item Quel indicateur statistique montre que les joueuses ont un profil similaire ?
\item Quel indicateur statistique permet de différentier les deux joueuses ?
\item Quelles conclusions la sélectionneuse peut-elle tirer de cette étude ?
\end{enumerate}
\end{exercise}
\begin{exercise}[subtitle={Recette}, step={1}, origin={<++>}, topics={ Indicateurs statistiques }, tags={ Statistiques, Python }, mode={\groupMode}]
Pour chaque indicateur suivant, détailler les étapes nécessaires pour le calculer. Vous illustrerez votre méthode avec un exemple.
\begin{tasks}(4)
\task Moyenne $\overline{x}$
\task Médiane $Me$
\task Premier Quartile $Q_1$
\task Troisième Quartile $Q_3$
\end{tasks}
\end{exercise}
\begin{exercise}[subtitle={Poissons}, step={2}, origin={<++>}, topics={ Indicateurs statistiques }, tags={ Statistiques, Python }, mode={\searchMode}]
Voici le nombre de poissons pêchés lors des 20 dernières sorties
\begin{eqnarray*}
1\quad ; \quad 5\quad ; \quad 5\quad ; \quad 7\quad ; \quad 3\quad ; \quad 3\quad ; \quad 6\quad ; \quad 6\quad ; \quad 1\quad ; \quad 1 \\
4\quad ; \quad 4\quad ; \quad 0\quad ; \quad 2\quad ; \quad 5\quad ; \quad 7\quad ; \quad 0\quad ; \quad 1\quad ; \quad 2\quad ; \quad 1
\end{eqnarray*}
\begin{enumerate}
\item Décrire la série statistique.
\item Dresser le tableau des effectifs (première ligne les valeurs rencontrées dans l'ordre croissant et en deuxième ligne l'effectif de chaque valeur).
\item Tracer un histogramme représentant ces valeurs (les valeurs en abscisse et l'effectif en ordonnée).
\item En vous basant sur le tableau des effectifs ou l'histogramme, calculer les indicateurs suivants
\begin{tasks}(4)
\task Moyenne $\overline{x}$
\task Médiane $Me$
\task Premier Quartile $Q_1$
\task Troisième Quartile $Q_3$
\end{tasks}
\end{enumerate}
\end{exercise}
\begin{exercise}[subtitle={Revenus - utilisation de la calculatrice}, step={3}, origin={<++>}, topics={ Indicateurs statistiques }, tags={ Statistiques, Python }, mode={\trainMode}]
On veut étudier la répartition des salaires des ménages de Petit-Ville. Une étude statistique a été faite et a donné les résultats suivants:
\hspace{-1cm}
\begin{tabular}{|p{2.5cm}|*{12}{c|}}
\smallsize
\hline
Salaires & 1300 & 1400 & 1500 & 1600 & 1700 & 1800 & 1900 & 2000 & 2100 & 2200 & 5300 & 8000 \\
\hline
Nombre de ménages & 13 & 9 & 9 & 7 & 16 & 12 & 10 & 8 & 8 & 3 & 4 & 1 \\
\hline
\end{tabular}
Des études similaires dans d'autres communes du département. Ces études ont donné les indicateurs suivants
\begin{center}
Moyenne des salaires : 1800 \hspace{2cm}
Médiane des salaires : 1800
\end{center}
\begin{enumerate}
\item Vous allez calculer les indicateurs de la série statistique sur les ménages de Petit-ville en utilisant la calculatrice.
\begin{enumerate}
\item Allez dans le menu statistique et entrer les données.
\item ...
\end{enumerate}
\item Le maire est interrogé par un journaliste au sujet de cette étude.
\begin{center}
\begin{itshape}
Ma ville est prospère! Je suis un bon maire, les habitants de Petit-Ville sont plus riches que les autres villes du département! Regardez notre salaire moyen est plus haut!
\end{itshape}
\end{center}
\item D'après votre étude êtes vous d'accord avec l'analyse du maire ? Peut-on dire la même chose si on compare les salaires médians ?
\item Pour expliquer l'écart entre la moyenne et la médiane, un journaliste décide de refaire cette étude en enlevant le foyer qui gagne 8000\euro.
\begin{enumerate}
\item Recalculer les indicateurs.
\item Pensez-vous que les habitants de Petit-Ville sont plus riches que les habitants des autres villes du département ?
\end{enumerate}
\end{enumerate}
\end{exercise}

View File

@ -0,0 +1,58 @@
Indicateurs statistiques
########################
:date: 2023-02-19
:modified: 2023-02-19
:authors: Benjamin Bertrand
:tags: Statistiques, Python
:category: 2nd
:summary: Indicateur de tendance centrale et de dispersion. Utilisation en programmation.
Éléments du programme
=====================
Contenus:
- Indicateurs de tendance centrale dune série statistique: moyenne pondérée.
- Linéarité de la moyenne.
- Indicateurs de dispersion: écart interquartile, écart type
Compétences:
- Décrire verbalement les différences entre deux séries statistiques, en sappuyant sur des indicateurs ou sur des représentations graphiques données.
- Pour des données réelles ou issues dune simulation, lire et comprendre une fonction écrite en Python renvoyant la moyenne m, lécart type s, et la proportion déléments appartenant à [m - 2s,m + 2s].
Progression
===========
Le cours est donné au début du cours, mais n'est pas lu en plénière ni commenté. Il sera complété par les écrits des élèves sur la méthode pour calculer les indicateurs. Ces écrits d'élèves permettront d'écrire les algorithmes avant de les programmer.
.. image:: ./1B_indicateurs.pdf
:height: 200px
:alt: Définition des indicateurs
Étape 1: Indicateurs sur des données brutes
-------------------------------------------
Des données sur plusieurs cas similaires. Les élèves doivent calculer les indicateurs pour comparer les séries.
Explication du calcul de la moyenne et de la médiane en groupe.
Étape 2: Indicateurs sur des données regroupées par effectif
------------------------------------------------------------
Étape 3: Moyenne pondérée
-------------------------
Exercice de moyenne de notes avec des pondérations différentes.
Il faut prévoir un ou deux exercices sur la Linéarité de la moyenne.
Étape 3: Programmation des indicateurs en Python
------------------------------------------------

Binary file not shown.

View File

@ -0,0 +1,44 @@
\documentclass[a4paper,12pt]{article}
\usepackage{myXsim}
\author{Benjamin Bertrand}
\title{Indicateurs statistiques - Plan de travail}
\tribe{2nd}
\date{février 2023}
\pagestyle{empty}
\DeclareExerciseCollection{banque}
\xsimsetup{
}
\begin{document}
\maketitle
% Résumé
\bigskip
Savoir-faire de la séquence
\begin{itemize}
\item Indicateurs de tendance centrale dune série statistique: moyenne pondérée.
\item Linéarité de la moyenne.
\item Indicateurs de dispersion: écart interquartile, écart type
\item Décrire verbalement les différences entre deux séries statistiques, en sappuyant sur des indicateurs ou sur des représentations graphiques données.
\item Pour des données réelles ou issues dune simulation, lire et comprendre une fonction écrite en Python renvoyant la moyenne m, lécart type s, et la proportion déléments appartenant à [m - 2s,m + 2s].
\end{itemize}
\bigskip
\section{}
\listsectionexercises
\pagebreak
\input{exercises.tex}
\printcollection{banque}
\end{document}

View File

@ -0,0 +1,28 @@
\documentclass[a4paper,10pt]{article}
\usepackage{myXsim}
\usetikzlibrary{shapes.geometric}
\author{Benjamin Bertrand}
\title{Indicateurs statistiques - Solutions}
\tribe{2nd}
\date{février 2023}
\DeclareExerciseCollection{banque}
\xsimsetup{
exercise/print=false,
solution/print=true,
}
\pagestyle{empty}
\begin{document}
\maketitle
\input{exercises.tex}
%\printcollection{banque}
%\printsolutions{exercises}
\end{document}