Feat: 6 étapes d'algo sur les stats
This commit is contained in:
parent
51f1c14c3c
commit
5dc07738fc
File diff suppressed because it is too large
Load Diff
|
@ -0,0 +1,257 @@
|
|||
{
|
||||
"cells": [
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"# Statistiques\n",
|
||||
"\n",
|
||||
"Le but de ce TP est de traiter la partie **statistique descriptive** du programme de 2nd. Les définitions données font donc partie du cours et sont à connaître par coeur.\n",
|
||||
"\n",
|
||||
"## Statistiques descriptives\n",
|
||||
"\n",
|
||||
"### Vocabulaire\n",
|
||||
"\n",
|
||||
"- La **population** d’une série statistique est l’ensemble des éléments appelés **individus** sur lesquels portent l’étude statistique.\n",
|
||||
"- Le **caractère** d’une série statistique est la propriété étudiée sur chaque individu. Un caractère peut être **quantitatif** (mesurable comme la taille) ou **qualitatif** (non mesurable comme la couleur des cheveux).\n",
|
||||
"- L’**effectif** d’un caractère est le nombre d’individu qui partagent ce caractère.\n",
|
||||
"- L'**effectif** total est le nombre total d'individu.\n",
|
||||
"- La **fréquence** d’un caractère est égale à l’effectif du caractère divisé par l’effectif total.\n",
|
||||
"\n",
|
||||
"Les statistiques descriptives ont pour but de décrire et d'analyser des données (ou série statisque) pour les résumer ou les comparer entre elles.\n",
|
||||
"\n",
|
||||
"Voici quelques séries de données sur lesquels nous allons pouvoir travailler. Ces trois séries concernent des caractéristiques différentes des voitures garées sur un parking."
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 1,
|
||||
"metadata": {},
|
||||
"outputs": [],
|
||||
"source": [
|
||||
"# Nombre de passagers\n",
|
||||
"passagers = [4, 1, 4, 1, 2, 1, 5, 0, 3, 4, 0, 4, 0, 0, 4, 3, 2, 3, 5, 2, 5, 4, 1, 2, 1]\n",
|
||||
"# Kilomètre au compteur\n",
|
||||
"kilometres = [68806, 136429, 67417, 44743, 166108, 63686, 133615,\n",
|
||||
" 97402, 131932, 60947, 166706, 194451, 103493, 71308, 69805]\n",
|
||||
"# Couleur des voitures\n",
|
||||
"couleurs = ['grise', 'noire', 'grise', 'rouge',\n",
|
||||
" 'blanche', 'blanche', 'rouge', 'bleu',\n",
|
||||
" 'bleu', 'grise', 'noire', 'verte',\n",
|
||||
" 'noire', 'rouge', 'grise', 'verte',\n",
|
||||
" 'grise', 'grise', 'verte', 'grise']"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"1. Pour chacune des ces séries statistiques, expliquer à quoi correspond la population, les individus, le caractère.\n",
|
||||
"2. Quel est l'effectif total de chacun de ces séries?"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"## Indicateurs\n",
|
||||
"\n",
|
||||
"Les indicteurs suivant vont permettre de résumer les séries statistiques. Ils ne peuvent être calculés que quand le caractère étudié est quantitatif. \n",
|
||||
"\n",
|
||||
"- **Etendu** est égale à la différence entre le **maximum** et le **minimum**.\n",
|
||||
"- La **moyenne**, $\\bar{x}$, est égale à la somme de toutes les valeurs divisée par l'effectif total.\n",
|
||||
"- La **médiane, Me**, est une valeur qui sépare la série en 2 groupes de même effectif:\n",
|
||||
" - un groupe dont les valeurs sont inférieurs ou égales à la médiane\n",
|
||||
" - un groupe dont les valeurs sont supérieurs ou égales à la médiane\n",
|
||||
"- Le **premier quartile**, $Q_1$, d’une série statistique est la plus petite valeur des termes de la série pour laquelle au moins un quart des données sont inférieures ou égales à $Q_1$.\n",
|
||||
"- Le **troisième quartile**, $Q_3$, d’une série statistique est la plus petite valeur des termes de la série pour laquelle au moins trois quarts des données sont inférieures ou égales à $Q_3$."
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"3. Pour chaque série, quand c'est possible, calculer les 5 indicateurs.\n",
|
||||
"4. Ecrire un algorithme expliquant comment calculer chaqu'un de ces indicateurs.\n",
|
||||
"5. En vous aidant du mémo sur les listes, traduire vos algorithmes en Python"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"## Mémo sur les listes\n",
|
||||
"\n",
|
||||
"Quelques précisions autour de la manipulation des listes avec Python"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 11,
|
||||
"metadata": {},
|
||||
"outputs": [],
|
||||
"source": [
|
||||
"L = [5, 2, 1, 2, 4, 5, 5]"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"- `len`: calculer le nombre d'éléments dans la liste"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 5,
|
||||
"metadata": {},
|
||||
"outputs": [
|
||||
{
|
||||
"name": "stdout",
|
||||
"output_type": "stream",
|
||||
"text": [
|
||||
"7\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"print(len(L))"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"- `sum`: calculer la somme des éléments de la liste"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 6,
|
||||
"metadata": {},
|
||||
"outputs": [
|
||||
{
|
||||
"name": "stdout",
|
||||
"output_type": "stream",
|
||||
"text": [
|
||||
"24\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"print(sum(L))"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"- `sorted`: trier les éléments de la liste"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 13,
|
||||
"metadata": {},
|
||||
"outputs": [
|
||||
{
|
||||
"name": "stdout",
|
||||
"output_type": "stream",
|
||||
"text": [
|
||||
"[1, 2, 2, 4, 5, 5, 5]\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"print(sorted(L))"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"- Récupérer le i-ième élément de la liste (**/!\\ on commence à compter à partir de 0**)"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 15,
|
||||
"metadata": {},
|
||||
"outputs": [
|
||||
{
|
||||
"name": "stdout",
|
||||
"output_type": "stream",
|
||||
"text": [
|
||||
"5\n",
|
||||
"1\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"# Le premier élément de la liste\n",
|
||||
"print(L[0])\n",
|
||||
"# le 3e élément de la liste\n",
|
||||
"print(L[2])"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"- Faire une boucle sur tous les éléments de la liste"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 16,
|
||||
"metadata": {},
|
||||
"outputs": [
|
||||
{
|
||||
"name": "stdout",
|
||||
"output_type": "stream",
|
||||
"text": [
|
||||
"5\n",
|
||||
"2\n",
|
||||
"1\n",
|
||||
"2\n",
|
||||
"4\n",
|
||||
"5\n",
|
||||
"5\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"for x in L:\n",
|
||||
" print(x)"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"metadata": {},
|
||||
"outputs": [],
|
||||
"source": []
|
||||
}
|
||||
],
|
||||
"metadata": {
|
||||
"kernelspec": {
|
||||
"display_name": "Python 3",
|
||||
"language": "python",
|
||||
"name": "python3"
|
||||
},
|
||||
"language_info": {
|
||||
"codemirror_mode": {
|
||||
"name": "ipython",
|
||||
"version": 3
|
||||
},
|
||||
"file_extension": ".py",
|
||||
"mimetype": "text/x-python",
|
||||
"name": "python",
|
||||
"nbconvert_exporter": "python",
|
||||
"pygments_lexer": "ipython3",
|
||||
"version": "3.7.2"
|
||||
}
|
||||
},
|
||||
"nbformat": 4,
|
||||
"nbformat_minor": 2
|
||||
}
|
|
@ -0,0 +1,146 @@
|
|||
{
|
||||
"cells": [
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 2,
|
||||
"metadata": {},
|
||||
"outputs": [],
|
||||
"source": [
|
||||
"import random"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"# Préparation des données stats"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 4,
|
||||
"metadata": {},
|
||||
"outputs": [
|
||||
{
|
||||
"data": {
|
||||
"text/plain": [
|
||||
"['grise',\n",
|
||||
" 'noire',\n",
|
||||
" 'grise',\n",
|
||||
" 'rouge',\n",
|
||||
" 'blanche',\n",
|
||||
" 'blanche',\n",
|
||||
" 'rouge',\n",
|
||||
" 'bleu',\n",
|
||||
" 'bleu',\n",
|
||||
" 'grise',\n",
|
||||
" 'noire',\n",
|
||||
" 'verte',\n",
|
||||
" 'noire',\n",
|
||||
" 'rouge',\n",
|
||||
" 'grise',\n",
|
||||
" 'verte',\n",
|
||||
" 'grise',\n",
|
||||
" 'grise',\n",
|
||||
" 'verte',\n",
|
||||
" 'grise']"
|
||||
]
|
||||
},
|
||||
"execution_count": 4,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"couleurs = [\"rouge\", \"noire\", \"blanche\", \"grise\", \"verte\", \"bleu\"]\n",
|
||||
"rand_color = [random.choice(couleurs) for _ in range(20)]\n",
|
||||
"rand_color"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 11,
|
||||
"metadata": {},
|
||||
"outputs": [
|
||||
{
|
||||
"data": {
|
||||
"text/plain": [
|
||||
"[68806,\n",
|
||||
" 136429,\n",
|
||||
" 67417,\n",
|
||||
" 44743,\n",
|
||||
" 166108,\n",
|
||||
" 63686,\n",
|
||||
" 133615,\n",
|
||||
" 97402,\n",
|
||||
" 131932,\n",
|
||||
" 60947,\n",
|
||||
" 166706,\n",
|
||||
" 194451,\n",
|
||||
" 103493,\n",
|
||||
" 71308,\n",
|
||||
" 69805]"
|
||||
]
|
||||
},
|
||||
"execution_count": 11,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"kms = [int(random.gauss(100000, 50000)) for _ in range(15)]\n",
|
||||
"kms"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 12,
|
||||
"metadata": {},
|
||||
"outputs": [
|
||||
{
|
||||
"data": {
|
||||
"text/plain": [
|
||||
"[5, 2, 1, 2, 4, 5, 5]"
|
||||
]
|
||||
},
|
||||
"execution_count": 12,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"nbr_passagers = list(range(6))\n",
|
||||
"passagers = [random.choice(nbr_passagers) for _ in range(7)]\n",
|
||||
"passagers"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"metadata": {},
|
||||
"outputs": [],
|
||||
"source": []
|
||||
}
|
||||
],
|
||||
"metadata": {
|
||||
"kernelspec": {
|
||||
"display_name": "Python 3",
|
||||
"language": "python",
|
||||
"name": "python3"
|
||||
},
|
||||
"language_info": {
|
||||
"codemirror_mode": {
|
||||
"name": "ipython",
|
||||
"version": 3
|
||||
},
|
||||
"file_extension": ".py",
|
||||
"mimetype": "text/x-python",
|
||||
"name": "python",
|
||||
"nbconvert_exporter": "python",
|
||||
"pygments_lexer": "ipython3",
|
||||
"version": "3.7.2"
|
||||
}
|
||||
},
|
||||
"nbformat": 4,
|
||||
"nbformat_minor": 2
|
||||
}
|
Loading…
Reference in New Issue