1 Thème D Séquence 8 Traitement des données
Thème D : Les données structurées et leur traitement
Séquence 8 : « Traitement des données »
Le thème D (Les données structurées et leur traitement) correspond aux deux séquences suivantes :
● Séquence 7 : À la découverte des données numériques
● Séquence 8 : Traitement des données
Cette séquence nécessite d’avoir traité la séquence 7 au préalable.
A. Le programme
Les capacités exigibles du BO pour cette séquence sont données ci-dessous. Les autres contenus du
thème Les données structurées et leur traitement ont été traités dans la séquence 7.
Contenus Capacités attendues du BO
traitées dans la séquence 8
Activités /
Exercices
Données Définir une donnée personnelle.
Identifier les principaux formats et représentations
de données.
Séquence 7
Exercice 2 page 67
Données structurées
Identifier les différents descripteurs d’un objet.
Distinguer la valeur d’une donnée de son
descripteur.
Utiliser un site de données ouvertes, pour
sélectionner et récupérer des données.
Séquence 7
Séquence 7
Séquence 7
Activité 1 page 61
Activité 2 page 62
Traitement de données
structurées Réaliser des opérations de recherche, filtre, tri ou
calcul sur une ou plusieurs tables.
Activité 2 page 62
Activité 3 page 63
Exercice 1 page 66
2 Thème D Séquence 8 Traitement des données
B. QCM diagnostic d’ouverture
Ces questions vont instaurer le débat, ou la discussion. Ce sont des questions ouvertes et il y a une
question d’amorçage pour chaque activité et chaque exercice.
Elles sont destinées à faire une évaluation diagnostic en début de séquence et sont disponibles sur
QCMCam et aux formats PDF, PPT et ODP sur le site web :
https://cahier-snt.fr/#!/diagnostic/seq8.
Activité 1 Selon vous, quel service propose un site web open data ? Réponses :
A. Télécharger gratuitement des données numériques publiques. (bonne réponse)
B. Sauvegarder ses données personnelles sur le cloud.
C. Visionner de la vidéo en streaming.
Activité 2 Une application permet de localiser l’emplacement des défibrillateurs cardiaques.
À quoi pourrait-elle servir ? Réponses :
A. Sauver des vies (bonne réponse)
B. Échanger des SMS avec ses amis
C. Partager des photos
Activité 3 Qu'est-ce qu’une base de données ? Réponses :
A. Une base militaire secrète
B. Une application qui permet d'échanger des données
C. Un service de stockage de données brutes (bonne réponse)
Exercice 1 Pour louer une trottinette électrique dans une grande ville afin de se déplacer, il faut :
Réponses :
A. installer une application dédiée. (bonne réponse)
B. arpenter toutes les rues de la ville jusqu’à trouver une trottinette disponible.
C. appeler le 15.
Exercice 2 Jeanne veut afficher sur son site web le nombre d'abonnés à sa chaîne YouTube.
Pour cela, elle doit :
Réponses :
A. récupérer les données de son compte YouTube. (bonne réponse)
B. contacter son fournisseur d’accès à Internet.
C. s’abonner à un maximum de réseaux sociaux.
3 Thème D Séquence 8 Traitement des données
C. Description des activités
Activité 1 p. 61 (voir la correction à la fin du paragraphe)
Capacités attendues :
● Utiliser un site de données ouvertes, pour sélectionner et récupérer des données.
Cette première activité propose de travailler sur de véritables données brutes issues d’un site Open
data français. Le but de l’activité est d’afficher sur une carte de France les emplacements des stations
de recharge pour véhicules électriques. Le jeu de données mis à disposition sur le site
https://www.data.gouv.fr/ est composé de 10 166 entrées en janvier 2020.
Pour cela, un certain nombre d’étapes doivent être respectées :
1. Se connecter sur le site web https://www.data.gouv.fr/.
2. Trouver la ressource que l’on souhaite analyser, puis la télécharger au format CSV.
3. Nettoyer la base de données en ne gardant que les descripteurs pertinents.
4. Renommer si nécessaire certains descripteurs.
5. Repérer d'éventuelles erreurs d'insertion dans la base de données (il peut toujours y avoir des
erreurs de colonne ou de ligne).
6. Sauvegarder les données ainsi préparées.
7. Afficher quelques emplacements sur l’interface LiveCSVMap développée spécifiquement
pour cette activité et disponible à cette adresse : https://cahier-snt.fr/livecsvmap/ ou sur le site
élève (https://lycee.editions-bordas.fr/cahier-SNT).
Question 8 : il est nécessaire que les valeurs de longitude et de latitude des stations aient pour
descripteur respectivement les noms « longitude » et « latitude ». En effet, l’interface LiveCSVMap a
besoin de ces deux mots clés pour fonctionner et afficher des positions. Il en serait exactement de
même avec un site comme OpenStreetMap ou autre.
Question 12 : Après avoir ouvert les données sauvegardées au format CSV avec le Bloc-notes, il est
facile de copier-coller quelques lignes du fichier CSV dans le module LiveCSVMap : instantanément,
les positions s’affichent sur une carte OpenStreetMap de France. Ce module a été spécialement
développé pour géolocaliser des points sur une carte du monde à l’aide de leurs coordonnées (latitude,
longitude). Aucun login ou mot de passe n'est nécessaire, conformément au RGPD.
Le module LiveCSVMap est entièrement réutilisable pour géolocaliser tout point à la surface de la
Terre, si l’on connaît sa latitude et sa longitude. Une proposition de correction est également
directement disponible dans l’interface LiveCSVMap à l’adresse : https://cahier-
snt.fr/livecsvmap/?csv=s8a1 et dans le site enseignant (https://sciences-numeriques.editions-
bordas.fr/cahier-SNT).
Activité 2 p. 62 (voir la correction à la fin du paragraphe)
Capacités attendues : ● Utiliser un site de données ouvertes, pour sélectionner et récupérer des données.
● Réaliser des opérations de recherche, filtre, tri ou calcul sur une ou plusieurs tables.
4 Thème D Séquence 8 Traitement des données
Tout en sensibilisant l’élève à l’importance de la formation PSC1 (prévention et secours civiques de
niveau 1), cette activité propose d’effectuer des opérations de filtrage sur des données réelles.
En effet, les données présentées sont de véritables données qui ont été communiquées début 2020 par
l'entreprise Staying Alive. Il s’agit de données issues de quelques villes du département des Pyrénées
Orientales. Le jeu de données mis à disposition est composé de 92 entrées.
L’activité vise à illustrer la présence de défibrillateurs autour de nous, il n’est donc pas nécessaire
d’avoir une base nationale complète, ce qui aurait également alourdi le fichier. Il est bien sûr possible
de travailler avec le jeu de données d’une autre ville ou d’un autre département.
Il a été choisi de travailler dans cette séquence avec le logiciel Calc de la suite OpenOffice, accessible
gratuitement. Pour travailler avec Excel ou un autre tableur, quelques adaptations seront sûrement
nécessaires mais la démarche est la même et les formules de calcul seront très similaires voire
identiques.
Cette activité propose de réaliser les opérations suivantes :
● Préparation de la base de données, selon le modèle de l’activité 1 page 61.
● Trier les données par code postal croissant.
● Filtrer les données pour n'afficher que les données de la ville de Perpignan.
● Compter le nombre de DAE (défibrillateurs) de la ville de Perpignan (au 1er janvier 2020).
Il est possible à tout instant de prolonger l’activité en géolocalisant les DAE sélectionnés aux
étapes précédentes : pour cela copier-coller quelques lignes du fichier CSV exporté, (ou
directement depuis le tableur), dans le module LiveCSVMap Afficher quelques emplacements
sur l’interface LiveCSVMap développée spécifiquement pour cette activité et disponible à
cette adresse : https://cahier-snt.fr/livecsvmap/ ou sur le site élève (https://lycee.editions-
bordas.fr/cahier-SNT). Instantanément, les positions s’affichent sur une carte de France
OpenStreetmap. Attention, si on utilise le copier-coller depuis le tableur, le caractère
séparateur ne sera pas la virgule (comme depuis un fichier CSV) mais le caractère « espace » :
la géolocalisation fonctionnera toujours parfaitement mais aucune virgule ne sera affichée, ce
qui pourrait perturber les élèves.
Une proposition de correction est également directement disponible dans l’interface LiveCSVMap
dans le site enseignant (https://sciences-numeriques.editions-bordas.fr/cahier-SNT) et à l’adresse :
https://cahier-snt.fr/livecsvmap/?csv=s8a2.
Activité 3 p. 63 (voir la correction à la fin du paragraphe)
Capacités attendues :
● Réaliser des opérations de recherche, filtre, tri ou calcul sur une ou plusieurs tables.
Cette activité ludique, très ambitieuse et très motivante, illustre la gestion des animaux d’un zoo à
l’aide d’une base de données composée de trois tables. Chaque table possède des informations
spécifiques et le croisement des données issues de plusieurs tables (2 au maximum dans cette activité)
sera parfois nécessaire pour répondre aux questions posées (c’est le cas à la question B).
5 Thème D Séquence 8 Traitement des données
L’objectif de l’activité est de répondre aux 4 questions suivantes :
A- Comment s'appellent les loups du zoo ?
B- Boubou est-il herbivore ?
C- Quel animal s’est blessé le 12 mai 2017, et comment ?
D- Quelle est l’espérance de vie d‘une tortue d’eau ?
Le fichier à télécharger base_zoo.odb (disponible dans le site élève https://lycee.editions-
bordas.fr/cahier-SNT) contient les 3 tables nécessaires à l'activité. Pour les mêmes raisons que pour le
tableur Calc, nous avons choisi de travailler avec le logiciel Base de la suite OpenOffice. Notons que
cette base peut tout à fait être mise à jour avec de nouvelles entrées de votre choix : arrivée d’un
nouvel animal au zoo, survenue d'une blessure, nouvelle race d'animal accueillie au zoo qui nécessite
un régime alimentaire très particulier, etc.
Le langage SQL est un des langages les plus connus pour extraire des informations d’une base de
données. Cette activité en propose une initiation simple. Le langage SQL est au programme de la
spécialité NSI de la classe de Terminale. SQL est un langage informatique normalisé. Il requiert
l'utilisation de mots clés qui sont présentés dans l’activité, comme SELECT, FROM, WHERE, etc.
Une requête écrite en langage SQL permet de rechercher, d'ajouter, de modifier ou de supprimer des
données dans la base de données.
Attention, avec le logiciel Base :
● Les mots clés (SELECT, etc.) sont écrit en majuscule pour les mettre en évidence mais ce
n’est pas indispensable.
● Les tables sont écrites entre double apostrophe, par exemple "races".
● Les descripteurs sont écrits entre double apostrophe, par exemple "nom" ou "blessure".
● Les chaînes de caractère sont écrites entre simple apostrophe, par exemple 'Loup' ou encore
'12/05/17'.
Voici les requêtes qui permettent de répondre aux questions C et D :
C- Quel animal s’est blessé le 12 mai 2017, et comment ?
D- Quelle est l’espérance de vie d‘une tortue d’eau ?
Une proposition de correction est également directement disponible dans le site enseignant
(https://sciences-numeriques.editions-bordas.fr/cahier-SNT) et à l’adresse : https://cahier-
snt.fr/res/ressources/base_zoo_correction.odb .
6 Thème D Séquence 8 Traitement des données
7 Thème D Séquence 8 Traitement des données
8 Thème D Séquence 8 Traitement des données
9 Thème D Séquence 8 Traitement des données
D. Description des exercices
Exercice 1 p. 66 (voir la correction à la fin du paragraphe)
Capacités attendues :
● Réaliser des opérations de recherche, filtre, tri ou calcul sur une ou plusieurs tables.
L'objectif de cet exercice est d’effectuer des opérations sur une base de données composée de 1 324
emplacements de trottinette de la ville de Paris.
L’élève pourra ainsi successivement :
1. Télécharger le jeu de données au format CSV (disponible dans le site élève
https://lycee.editions-bordas.fr/cahier-SNT).
2. Sélectionner uniquement les descripteurs pertinents et effacer les autres.
3. Calculer le nombre d’emplacements à Paris à l’aide d’une formule de calcul, qui est donnée.
4. Trouver un critère permettant de sélectionner uniquement les emplacements du 15e
arrondissement.
5. Faire de même avec les emplacements du 15e et du 12e arrondissement (nécessité d’employer
l'opérateur logique AND du langage SQL).
6. Afficher les emplacements souhaités sur une carte OpenStreetmap de la ville de Paris, à l'aide
du module LiveCSVMap.
Une proposition de correction est également directement disponible dans l’interface LiveCSVMap
dans le site enseignant (https://sciences-numeriques.editions-bordas.fr/cahier-SNT) et à l’adresse :
https://cahier-snt.fr/livecsvmap/?csv=s8e1.
Exercice 2 p. 63 (voir la correction à la fin du paragraphe)
Capacités attendues :
● Identifier les principaux formats et représentations de données.
Cet exercice propose de découvrir un format structuré de données incontournable : le format JSON. La
prononciation à la française est /ʒi. sɔn/ ou /dʒej. sɔn/ , ou à l'anglaise /ˈdʒeɪˌsən/ , comme Jason
Bourne.
JSON signifie JavaScript Object Notation.
Ce format structuré utilise un enchaînement d’accolades, de doubles apostrophes comme "item", de
crochets et de virgules.
Ce format est organisé selon le modèle "clé" : "valeur".
Notons bien que l’exploitation informatique d’un tel fichier nécessiterait un algorithme de traitement
performant. Par exemple, en Python, le module json est un des modules les plus connus.
10 Thème D Séquence 8 Traitement des données
11 Thème D Séquence 8 Traitement des données
Des QCM d’auto-évaluation sont disponibles pour un travail en autonomie de l’élève
à l’adresse : https://cahier-snt.fr/#!/revision/seq8.
Site web avec toutes les ressources pour les élèves : https://lycee.editions-bordas.fr/cahier-SNT.
Site web pour l’enseignant : https://sciences-numeriques.editions-bordas.fr/cahier-SNT.