2022-2023/2nd/12_Indicateurs_statistiques/1B_indicateurs.tex

84 lines
3.6 KiB
TeX

\documentclass[a4paper,10pt]{article}
\usepackage{myXsim}
\usepackage{pgfplots}
\pgfplotsset{compat=1.18}
\author{Benjamin Bertrand}
\title{Indicateurs statistiques - Cours}
\date{février 2023}
\pagestyle{empty}
\begin{document}
\maketitle
\section{Description d'une série statistique}
\begin{definition}[Description]
Une série statistique peut se décrire suivant les 3 éléments suivants
\begin{itemize}
\item \textbf{La population}: l'ensemble complet de toutes les observations possibles qui ont été faites.
\item \textbf{Les individus}: les membres qui composent cette population.
\item \textbf{Le caractère étudié}: ce qui est mesurée ou observée dans chaque individu de la population.
\end{itemize}
\end{definition}
\paragraph{Remarque:} Il est important de bien définir la population, les individus et le caractère étudié lors de la collecte de données statistiques, car cela permet de garantir que les résultats obtenus sont précis et applicables à la population étudiée.
\begin{definition}[Effectif]
\noindent
\textbf{L'effectif} d'un ensemble est le nombre d'éléments dans cet ensemble.
\textbf{L'effectif total} d'une population est le nombre d'individus dans cette population.
\end{definition}
\section{Indicateurs de tendance centrale}
Ces indicateurs vont chercher à décrire le "centre" de la série statistique. Autour de quels valeurs toutes les autres gravitent.
\begin{definition}[La médiane]
La \textbf{médiane}, noté \textbf{Me}, est la plus petite valeur de la série pour laquelle \textbf{la moitié} (50\%) des valeurs lui sont inférieurs ou égales.
\end{definition}
\begin{definition}[La moyenne]
La \textbf{moyenne} est la valeur typique d'une série de donnée. On la note $\overline{x}$ et elle se calcule en faisant la somme des valeurs divisé par l'effectif.
\[
\overline{x} = \frac{x_1 + x_2 + ... + x_N}{N}
\]
\end{definition}
\begin{definition}[La moyenne pondérée]
Lorsque l'on souhaite donner plus de poids à certaines valeurs qu'à d'autres, on peut attribuer des poids différents à chaque valeur (coefficients, effectif...).
La moyenne prenant compte de ces poids est une \textbf{moyenne pondérée} et en notant les poids $c_i$ et les valeurs $x_i$ on a
\[
\overline{x} = \frac{x_1\times c_1 + x_2\times c_2 + ... + x_N\times c_N}{c_1 + c_2 + ... + x_N}
\]
\end{definition}
\paragraph{Remarque}: La médiane est moins sensible aux valeurs extrêmes que la moyenne. C'est à dire que si quelques données sont "anormale", la valeur de la médiane sera moins impactée que la moyenne.
\section{Indicateur de dispersion}
Ces indicateurs vont chercher à décrire l'étalement des valeurs.
\begin{definition}[Les quartiles]
\begin{itemize}
\item Le premier quartile, noté \textbf{Q1}, est la plus petite valeur telle que \textbf{un quart} des valeur lui sont inférieurs ou égale.
\item Le troisième quartile, noté \textbf{Q3}, est la plus petite valeur telle que \textbf{trois quart} des valeur lui sont inférieurs ou égale.
\item \textbf{L'écart interquartile} est la différence entre Q1 et Q3: \textbf{Q3 - Q1}
\end{itemize}
\end{definition}
\begin{definition}[L'écart-type]
\textbf{L'écart type}, noté $\sigma$, est la mesure de l'écart entre les valeurs et la moyenne. En notant, $x_i$ les valeurs, on la calcule avec la formule suivante:
\[
\sigma = \sqrt{\frac{(x_1 - \overline{x})^2 +(x_2 - \overline{x})^2 + ... + (x_N - \overline{x})^2 }{N}}
\]
\end{definition}
\end{document}