{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "# Traitement de données avec python\n", "\n", "Dans ce TP, vous allez explorer concernant la population de toutes les villes française dans un premier temps puis les festivals.\n", "\n" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Villes de France\n", "\n", "À côté de ce document, vous trouverez un document `villes.csv` . Le copier dans son dossier personnel puis l'ouvrir avec notepad++\n", "\n", "### Description des données\n", "\n", "1. Décrire le format du fichier.\n", "2. Quelles sont les informations stockées dans ce fichier?\n", "3. À quoi correspond chaque ligne?\n", "3. Combien de lignes va-t-on pouvoir étudier?\n", "\n", "4. Rédiger deux questions qui pourrait être répondu en utilisant ce tableau.\n" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "### Ouverture et manipulation avec python\n", "\n", "Ouvrir pythonedu, copier/coller le programme ci-dessous et sauvegarder votre script (vide) dans le même dossier où vous avez mis le fichier `villes.csv`.\n", "\n" ] }, { "cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [], "source": [ "import pandas as pd\n", "villes = pd.read_csv(\"villes.csv\")\n", "print(villes)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "6. Executer ce programme. Que fait-il? Commenter ce qui s'est écrit dans la console." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Festivals en France\n", "\n", "1. Aller sur la [plateforme d'opendata de l'état français](https://www.data.gouv.fr/fr/) et trouver des données sur les festivals de France\n", "2. Décrire les données trouvée\n", "3. Trouver 2 questions et essayer d'y répondre en utilisant Python" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Mémo Python et pandas" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Séléctionner une information\n", "\n", "- Séléctionner une ligne (ici la ligne 2)" ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "dep 1\n", "nom Plagne\n", "cp 1130\n", "nb_hab_2010 129\n", "nb_hab_1999 83\n", "nb_hab_2012 100\n", "dens 20\n", "surf 6.2\n", "long 5.73333\n", "lat 46.1833\n", "alt_min 560\n", "alt_max 922\n", "Name: 2, dtype: object" ] }, "execution_count": 2, "metadata": {}, "output_type": "execute_result" } ], "source": [ "villes.iloc[2]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "- Séléctionner une seule information (ici `cp` de la ligne 2)" ] }, { "cell_type": "code", "execution_count": 3, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "'1130'" ] }, "execution_count": 3, "metadata": {}, "output_type": "execute_result" } ], "source": [ "villes.loc[2,'cp']" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "- Séléctionner tout une colonne (ici `nom`)" ] }, { "cell_type": "code", "execution_count": 4, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "0 Ozan\n", "1 Cormoranche-sur-Saône\n", "2 Plagne\n", "3 Tossiat\n", "4 Pouillat\n", " ... \n", "36695 Sada\n", "36696 Tsingoni\n", "36697 Saint-Barthélemy\n", "36698 Saint-Martin\n", "36699 Saint-Pierre-et-Miquelon\n", "Name: nom, Length: 36700, dtype: object" ] }, "execution_count": 4, "metadata": {}, "output_type": "execute_result" } ], "source": [ "villes[\"nom\"]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "- Séléctionner les lignes suivant une caractéristique (ici les villes avec une altitude minimum supérieur à 1500)" ] }, { "cell_type": "code", "execution_count": 5, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", " | dep | \n", "nom | \n", "cp | \n", "nb_hab_2010 | \n", "nb_hab_1999 | \n", "nb_hab_2012 | \n", "dens | \n", "surf | \n", "long | \n", "lat | \n", "alt_min | \n", "alt_max | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|
1618 | \n", "4 | \n", "Larche | \n", "4540 | \n", "74 | \n", "83 | \n", "100 | \n", "1 | \n", "68.86 | \n", "6.85000 | \n", "44.4500 | \n", "1606.0 | \n", "3165.0 | \n", "
1790 | \n", "5 | \n", "Ristolas | \n", "5460 | \n", "90 | \n", "78 | \n", "100 | \n", "1 | \n", "82.18 | \n", "6.95000 | \n", "44.7667 | \n", "1571.0 | \n", "3294.0 | \n", "
1798 | \n", "5 | \n", "Saint-Véran | \n", "5350 | \n", "257 | \n", "265 | \n", "300 | \n", "5 | \n", "44.75 | \n", "6.86667 | \n", "44.7000 | \n", "1756.0 | \n", "3175.0 | \n", "
1847 | \n", "5 | \n", "Molines-en-Queyras | \n", "5350 | \n", "315 | \n", "322 | \n", "300 | \n", "5 | \n", "53.62 | \n", "6.85000 | \n", "44.7333 | \n", "1625.0 | \n", "3160.0 | \n", "
1904 | \n", "5 | \n", "Abriès | \n", "5460 | \n", "365 | \n", "358 | \n", "400 | \n", "4 | \n", "77.13 | \n", "6.93333 | \n", "44.7833 | \n", "1513.0 | \n", "3305.0 | \n", "
1923 | \n", "5 | \n", "Villar-d'Arêne | \n", "5480 | \n", "287 | \n", "217 | \n", "300 | \n", "3 | \n", "77.51 | \n", "6.33711 | \n", "45.0423 | \n", "1519.0 | \n", "3883.0 | \n", "
26927 | \n", "66 | \n", "La Llagonne | \n", "66210 | \n", "242 | \n", "264 | \n", "300 | \n", "10 | \n", "23.09 | \n", "2.11667 | \n", "42.5333 | \n", "1546.0 | \n", "2196.0 | \n", "
26943 | \n", "66 | \n", "Caudiès-de-Conflent | \n", "66360 | \n", "13 | \n", "6 | \n", "0 | \n", "2 | \n", "6.50 | \n", "2.16139 | \n", "42.5673 | \n", "1616.0 | \n", "2045.0 | \n", "
27039 | \n", "66 | \n", "Porté-Puymorens | \n", "66760 | \n", "131 | \n", "147 | \n", "100 | \n", "2 | \n", "49.42 | \n", "1.83333 | \n", "42.5500 | \n", "1557.0 | \n", "2827.0 | \n", "
27125 | \n", "66 | \n", "Mont-Louis | \n", "66210 | \n", "247 | \n", "272 | \n", "300 | \n", "633 | \n", "0.39 | \n", "2.11667 | \n", "42.5167 | \n", "1516.0 | \n", "1608.0 | \n", "
27134 | \n", "66 | \n", "Angles | \n", "66210 | \n", "566 | \n", "589 | \n", "600 | \n", "13 | \n", "43.20 | \n", "2.07445 | \n", "42.5778 | \n", "1531.0 | \n", "2808.0 | \n", "
29970 | \n", "73 | \n", "Bessans | \n", "73480 | \n", "343 | \n", "310 | \n", "300 | \n", "2 | \n", "128.08 | \n", "6.99167 | \n", "45.3167 | \n", "1673.0 | \n", "3754.0 | \n", "
30114 | \n", "73 | \n", "Val-d'Isère | \n", "73150 | \n", "1563 | \n", "1628 | \n", "1600 | \n", "16 | \n", "94.39 | \n", "6.98333 | \n", "45.4500 | \n", "1785.0 | \n", "3599.0 | \n", "
30127 | \n", "73 | \n", "Bonneval-sur-Arc | \n", "73480 | \n", "241 | \n", "239 | \n", "200 | \n", "2 | \n", "82.72 | \n", "7.05000 | \n", "45.3667 | \n", "1759.0 | \n", "3642.0 | \n", "
\n", " | dep | \n", "nom | \n", "cp | \n", "nb_hab_2010 | \n", "nb_hab_1999 | \n", "nb_hab_2012 | \n", "dens | \n", "surf | \n", "long | \n", "lat | \n", "alt_min | \n", "alt_max | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|
21096 | \n", "55 | \n", "Bezonvaux | \n", "55100 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "9.23 | \n", "5.46750 | \n", "49.2367 | \n", "226.0 | \n", "367.0 | \n", "
21155 | \n", "55 | \n", "Louvemont-Côte-du-Poivre | \n", "55100 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "8.25 | \n", "5.39834 | \n", "49.2378 | \n", "214.0 | \n", "375.0 | \n", "
21038 | \n", "55 | \n", "Fleury-devant-Douaumont | \n", "55100 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "10.27 | \n", "5.43445 | \n", "49.1950 | \n", "227.0 | \n", "390.0 | \n", "
21051 | \n", "55 | \n", "Haumont-près-Samogneux | \n", "55100 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "10.81 | \n", "5.35251 | \n", "49.2728 | \n", "194.0 | \n", "355.0 | \n", "
21300 | \n", "55 | \n", "Beaumont-en-Verdunois | \n", "55100 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "7.87 | \n", "5.40778 | \n", "49.2587 | \n", "233.0 | \n", "372.0 | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
2049 | \n", "6 | \n", "Nice | \n", "06000-06100-06200-06300 | \n", "343304 | \n", "343123 | \n", "344900 | \n", "4773 | \n", "71.92 | \n", "7.25000 | \n", "43.7000 | \n", "0.0 | \n", "520.0 | \n", "
11718 | \n", "31 | \n", "Toulouse | \n", "31000-31100-31200-31300-31400-31500 | \n", "441802 | \n", "390301 | \n", "439600 | \n", "3734 | \n", "118.30 | \n", "1.43333 | \n", "43.6000 | \n", "115.0 | \n", "263.0 | \n", "
28152 | \n", "69 | \n", "Lyon | \n", "69001-69002-69003-69004-69005-69006-69007-6900... | \n", "484344 | \n", "445274 | \n", "474900 | \n", "10117 | \n", "47.87 | \n", "4.84139 | \n", "45.7589 | \n", "162.0 | \n", "312.0 | \n", "
4439 | \n", "13 | \n", "Marseille | \n", "13001-13002-13003-13004-13005-13006-13007-1300... | \n", "850726 | \n", "797491 | \n", "851400 | \n", "3535 | \n", "240.62 | \n", "5.37639 | \n", "43.2967 | \n", "0.0 | \n", "640.0 | \n", "
30437 | \n", "75 | \n", "Paris | \n", "75001-75002-75003-75004-75005-75006-75007-7500... | \n", "2243833 | \n", "2125851 | \n", "2211000 | \n", "21288 | \n", "105.40 | \n", "2.34445 | \n", "48.8600 | \n", "27.0 | \n", "127.0 | \n", "
36700 rows × 12 columns
\n", "\n", " | dep | \n", "nom | \n", "cp | \n", "nb_hab_2010 | \n", "nb_hab_1999 | \n", "nb_hab_2012 | \n", "dens | \n", "surf | \n", "long | \n", "lat | \n", "alt_min | \n", "alt_max | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|
30114 | \n", "73 | \n", "Val-d'Isère | \n", "73150 | \n", "1563 | \n", "1628 | \n", "1600 | \n", "16 | \n", "94.39 | \n", "6.98333 | \n", "45.45000 | \n", "1785.0 | \n", "3599.0 | \n", "
30127 | \n", "73 | \n", "Bonneval-sur-Arc | \n", "73480 | \n", "241 | \n", "239 | \n", "200 | \n", "2 | \n", "82.72 | \n", "7.05000 | \n", "45.36670 | \n", "1759.0 | \n", "3642.0 | \n", "
1798 | \n", "5 | \n", "Saint-Véran | \n", "5350 | \n", "257 | \n", "265 | \n", "300 | \n", "5 | \n", "44.75 | \n", "6.86667 | \n", "44.70000 | \n", "1756.0 | \n", "3175.0 | \n", "
29970 | \n", "73 | \n", "Bessans | \n", "73480 | \n", "343 | \n", "310 | \n", "300 | \n", "2 | \n", "128.08 | \n", "6.99167 | \n", "45.31670 | \n", "1673.0 | \n", "3754.0 | \n", "
1847 | \n", "5 | \n", "Molines-en-Queyras | \n", "5350 | \n", "315 | \n", "322 | \n", "300 | \n", "5 | \n", "53.62 | \n", "6.85000 | \n", "44.73330 | \n", "1625.0 | \n", "3160.0 | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
36695 | \n", "976 | \n", "Sada | \n", "97640 | \n", "10195 | \n", "10195 | \n", "10195 | \n", "933 | \n", "10.92 | \n", "45.10470 | \n", "-12.84860 | \n", "NaN | \n", "NaN | \n", "
36696 | \n", "976 | \n", "Tsingoni | \n", "97680 | \n", "10454 | \n", "10454 | \n", "10454 | \n", "300 | \n", "34.76 | \n", "45.10700 | \n", "-12.78970 | \n", "NaN | \n", "NaN | \n", "
36697 | \n", "971 | \n", "Saint-Barthélemy | \n", "97133 | \n", "8938 | \n", "8938 | \n", "8938 | \n", "372 | \n", "24.00 | \n", "-62.83330 | \n", "17.91670 | \n", "NaN | \n", "NaN | \n", "
36698 | \n", "971 | \n", "Saint-Martin | \n", "97150 | \n", "36979 | \n", "36979 | \n", "36979 | \n", "695 | \n", "53.20 | \n", "18.09130 | \n", "-63.08290 | \n", "NaN | \n", "NaN | \n", "
36699 | \n", "975 | \n", "Saint-Pierre-et-Miquelon | \n", "97500 | \n", "6080 | \n", "6080 | \n", "6080 | \n", "25 | \n", "242.00 | \n", "46.71070 | \n", "1.71819 | \n", "NaN | \n", "NaN | \n", "
36700 rows × 12 columns
\n", "\n", " | dep | \n", "nom | \n", "cp | \n", "nb_hab_2010 | \n", "nb_hab_1999 | \n", "nb_hab_2012 | \n", "dens | \n", "surf | \n", "long | \n", "lat | \n", "alt_min | \n", "alt_max | \n", "diff_10_12 | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "1 | \n", "Ozan | \n", "1190 | \n", "618 | \n", "469 | \n", "500 | \n", "93 | \n", "6.60 | \n", "4.91667 | \n", "46.38330 | \n", "170.0 | \n", "205.0 | \n", "-118 | \n", "
1 | \n", "1 | \n", "Cormoranche-sur-Saône | \n", "1290 | \n", "1058 | \n", "903 | \n", "1000 | \n", "107 | \n", "9.85 | \n", "4.83333 | \n", "46.23330 | \n", "168.0 | \n", "211.0 | \n", "-58 | \n", "
2 | \n", "1 | \n", "Plagne | \n", "1130 | \n", "129 | \n", "83 | \n", "100 | \n", "20 | \n", "6.20 | \n", "5.73333 | \n", "46.18330 | \n", "560.0 | \n", "922.0 | \n", "-29 | \n", "
3 | \n", "1 | \n", "Tossiat | \n", "1250 | \n", "1406 | \n", "1111 | \n", "1400 | \n", "138 | \n", "10.17 | \n", "5.31667 | \n", "46.13330 | \n", "244.0 | \n", "501.0 | \n", "-6 | \n", "
4 | \n", "1 | \n", "Pouillat | \n", "1250 | \n", "88 | \n", "58 | \n", "100 | \n", "14 | \n", "6.23 | \n", "5.43333 | \n", "46.33330 | \n", "333.0 | \n", "770.0 | \n", "12 | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
36695 | \n", "976 | \n", "Sada | \n", "97640 | \n", "10195 | \n", "10195 | \n", "10195 | \n", "933 | \n", "10.92 | \n", "45.10470 | \n", "-12.84860 | \n", "NaN | \n", "NaN | \n", "0 | \n", "
36696 | \n", "976 | \n", "Tsingoni | \n", "97680 | \n", "10454 | \n", "10454 | \n", "10454 | \n", "300 | \n", "34.76 | \n", "45.10700 | \n", "-12.78970 | \n", "NaN | \n", "NaN | \n", "0 | \n", "
36697 | \n", "971 | \n", "Saint-Barthélemy | \n", "97133 | \n", "8938 | \n", "8938 | \n", "8938 | \n", "372 | \n", "24.00 | \n", "-62.83330 | \n", "17.91670 | \n", "NaN | \n", "NaN | \n", "0 | \n", "
36698 | \n", "971 | \n", "Saint-Martin | \n", "97150 | \n", "36979 | \n", "36979 | \n", "36979 | \n", "695 | \n", "53.20 | \n", "18.09130 | \n", "-63.08290 | \n", "NaN | \n", "NaN | \n", "0 | \n", "
36699 | \n", "975 | \n", "Saint-Pierre-et-Miquelon | \n", "97500 | \n", "6080 | \n", "6080 | \n", "6080 | \n", "25 | \n", "242.00 | \n", "46.71070 | \n", "1.71819 | \n", "NaN | \n", "NaN | \n", "0 | \n", "
36700 rows × 13 columns
\n", "