td analyse de données pour l’évaluation de l ... · - appende à faie un calcul d’exposition...

20
UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 1 TD Analyse de données pour l’évaluation de l’exposition Octobre 2014 1 Contexte et objectif du TD Pour réaliser une évaluation de l’exposition d’une population à un contaminant chimique, plusieurs sources de données sont nécessaires : des données de consommations alimentaires d’une part et des données de composition des aliments d’autre part. La précision de l’évaluation de l’exposition dépend à la fois de la méthodologie employée et des données utilisées. Les données utilisées proviennent la plupart du temps de fournisseurs différents et ont souvent été produites pour des objectifs différents. Un travail d’analyse et de préparation des données est donc nécessaire avant tout calcul. Ce travail de préparation permet d’utiliser correctement les données et de pouvoir exploiter les résultats au mieux. L’objectif de ce TD est de découvrir les problématiques de gestion et de traitements des données auxquelles nous sommes confrontés au cours d’une analyse du risque alimentaire. Dans ce TD, nous souhaitons mener une évaluation de l’exposition d’une population au plomb. Il s’articulera en 3 phases : - Apprendre à faire un calcul d’exposition - Analyser et préparer les données de consommation - Analyser et préparer les données de contamination Pour simplifier ce TD, nous nous abstenons des problématiques de conversion d’unités et supposerons que les chiffres présentés sont dans des unités de mesure cohérentes. Ce TD se déroule sur 3 heures : vous devez donc consacrer environ 1 heure pour chacune des phases. Ce que vous devez rendre à la fin du TD A la fin de ce TD, vous devez remettre les fichiers Excel correspondant à votre travail effectué pendant ce TD. Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu, créez un dossier avec les noms de famille de votre binôme (par exemple Dupont_Durand). Dans la suite de ce document, nous ferons référence à ce dossier sous le terme dossier_de_votre_binome.

Upload: nguyenkhanh

Post on 15-Sep-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: TD Analyse de données pour l’évaluation de l ... · - Appende à faie un calcul d’exposition ... Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu, créez

UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 1

TD Analyse de données pour l’évaluation de l’exposition Octobre 2014

1 Contexte et objectif du TD

Pour réaliser une évaluation de l’exposition d’une population à un contaminant chimique, plusieurs sources

de données sont nécessaires : des données de consommations alimentaires d’une part et des données de

composition des aliments d’autre part. La précision de l’évaluation de l’exposition dépend à la fois de la

méthodologie employée et des données utilisées.

Les données utilisées proviennent la plupart du temps de fournisseurs différents et ont souvent été produites

pour des objectifs différents. Un travail d’analyse et de préparation des données est donc nécessaire avant

tout calcul. Ce travail de préparation permet d’utiliser correctement les données et de pouvoir exploiter les

résultats au mieux.

L’objectif de ce TD est de découvrir les problématiques de gestion et de traitements des données auxquelles

nous sommes confrontés au cours d’une analyse du risque alimentaire. Dans ce TD, nous souhaitons mener

une évaluation de l’exposition d’une population au plomb.

Il s’articulera en 3 phases :

- Apprendre à faire un calcul d’exposition

- Analyser et préparer les données de consommation

- Analyser et préparer les données de contamination

Pour simplifier ce TD, nous nous abstenons des problématiques de conversion d’unités et supposerons que

les chiffres présentés sont dans des unités de mesure cohérentes.

Ce TD se déroule sur 3 heures : vous devez donc consacrer environ 1 heure pour chacune des phases.

Ce que vous devez rendre à la fin du TD

A la fin de ce TD, vous devez remettre les fichiers Excel correspondant à votre travail effectué pendant ce TD.

Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu, créez un dossier avec les noms

de famille de votre binôme (par exemple Dupont_Durand).

Dans la suite de ce document, nous ferons référence à ce dossier sous le terme dossier_de_votre_binome.

Page 2: TD Analyse de données pour l’évaluation de l ... · - Appende à faie un calcul d’exposition ... Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu, créez

UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 2

2 TD 1 – calculer une exposition

L’objectif de ce TD est de réaliser un premier calcul d’exposition à partir de données déjà préparées.

Où trouver les données pour le TD ?

L’ensemble des fichiers nécessaires pour le TD 1 se trouvent sur le lecteur réseau TD dans le dossier

UC_Risque_Analyse_Donnees/TD1.

FAITES UNE COPIE DE CE DOSSIER SUR VOTRE ESPACE DISQUE N:/

2.1 Réaliser un calcul d’exposition

Dans cette partie, nous allons travailler sur le fichier calcul_exposition_plomb.xls, plus précisément avec les

feuilles intitulées matrice_contamination et matrice_consommation_ENQ1.

La feuille intitulée matrice_contamination contient une matrice représentant la moyenne des teneurs en

plomb pour plusieurs groupes d’aliments. Cette matrice a été réalisée à partir d’un ensemble de teneurs en

plomb mesurées dans différents aliments puis regroupées selon différents groupes d’aliments.

La feuille intitulée matrice_consommation_ENQ1 contient une matrice représentant la consommation

hebdomadaire en différents groupes d’aliments d’une population d’individus ayant répondus à une enquête

de consommation que nous nommerons ENQ1. Ces consommations ont été divisées par le poids des individus.

Description des champs de la feuille matrice_consommation_ENQ1

Nom du champ Description

identi Identifiant de la personne ayant répondu à l’enquête

libellegroupe Libellé du groupe aliments consommés

SommeDeqte Sommes des quantités consommées divisées par le poids de l’individu

Notre objectif dans cette partie est de calculer l’exposition de notre population au plomb pour les groupes

aliments Abats et Crustacés et mollusques.

Question 1 : Avant de faire le calcul d’exposition proprement dit, nous devons préparer nos données de

consommation : nous devons filtrer les consommations et ne conserver que celles correspondant aux groupes

d’aliments désirés pour pouvoir les multiplier avec les moyennes de contamination correspondantes.

- Construisez un tableau croisé dynamique représentant les sommes des consommations des individus

de l’enquête ENQ1 en Abats et en Crustacés et mollusques. Vous placerez notamment dans le tableau

croisé dynamique :

o la variable identi dans la zone champs de ligne

o la variable libellegroupe dans la zone de champs de colonne.

- Renommez la feuille de calcul contenant ce tableau croisé en tableau_ENQ1.

Page 3: TD Analyse de données pour l’évaluation de l ... · - Appende à faie un calcul d’exposition ... Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu, créez

UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 3

- Notez que vous n’avez que les consommateurs d’Abats et/ou de Crustacés et mollusques. Faites

apparaitre les non-consommateurs en prenant soin que la quantité affichée dans le tableau soit 0 pour

ces non consommateurs.

- Combien d’individus sont présents dans votre tableau croisé avant l’affichage des éléments sans

données ? …………………………………………………………………………………………………………………………………………..

- Combien d’individus sont présents dans votre tableau croisé après l’affichage des éléments sans

données ………………………………………………………………………………………………………………………………………………

- Quelle est donc la taille de la population de l’ENQ 1 ? …………………………………………………………………………

Aide :

Dans un tableau croisé dynamique, pour faire afficher les éléments sans données :

- Faites un clic droit sur la variable considérée dans le tableau croisé

- Un menu contextuel s’ouvre. Choisissez alors Champ.

- Une fenêtre apparait alors. Cochez la case Afficher les éléments sans données.

Page 4: TD Analyse de données pour l’évaluation de l ... · - Appende à faie un calcul d’exposition ... Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu, créez

UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 4

Aide :

Dans un tableau croisé dynamique, pour modifier la valeur affichée pour les cellules vides :

- Faites un clic droit sur le tableau croisé

- Un menu contextuel s’ouvre. Choisissez alors Options du tableau.

- Une fenêtre apparait alors. Cochez la case Cellules vides, afficher et saisissez le chiffre 0 dans la zone

de texte adjacente.

Page 5: TD Analyse de données pour l’évaluation de l ... · - Appende à faie un calcul d’exposition ... Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu, créez

UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 5

Question 2 : Nous allons maintenant réaliser le calcul d’exposition de la population de l’ENQ1 au plomb pour

le groupe d’aliments Abats.

- Dans une cellule (en dehors du tableau croisé), faites la multiplication de la quantité consommées en

Abats pour le premier individu de notre enquête (numéro = 1000101) avec la teneur moyenne en

plomb pour ce groupe d’aliments.

- Propagez maintenant ce calcul aux autres individus de l’enquête.

- Quelle est l’exposition de l’individu 2235301 pour le groupe Abats ? ………………………………..…………………

- Quelle est l’exposition de l’individu 4737601 pour le groupe Abats ? …………………………………………………..

Question 3 :

- En suivant la même méthode, calculez l’exposition de la population de l’ENQ1 au plomb pour le groupe

d’aliments Crustacés et mollusques.

- Quelle est l’exposition de l’individu 4791101 pour le groupe Crustacés et mollusques ?

…………………………………………………………………………………………………………………………………………………………….

- Quelle est l’exposition de l’individu 4737601 pour le groupe Crustacés et mollusques ?

…………………………………………………………………………………………………………………………………………………………….

Aide :

Vous devez obtenir quelque chose de similaire à cette image :

Aide :

Vous devriez avoir utilisé les références absolues…..

Page 6: TD Analyse de données pour l’évaluation de l ... · - Appende à faie un calcul d’exposition ... Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu, créez

UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 6

Question 4 : Pour les besoins de ce TD, nous supposerons que la DHT du plomb est de 250.

- Représentez sur un même graphique les expositions des individus au plomb et la DHT pour le groupe

Abats.

- Représentez sur un même graphique les expositions des individus au plomb et la DHT pour le groupe

Crustacés et mollusques.

- Calculer l’amplitude de dépassement de la DHT pour chaque individu de l’ENQ1 pour les groupes

d’aliments Abats et Crustacés et mollusques.

- Quelles sont vos conclusions quant à l’exposition de cette population au plomb pour ces deux groupes

d’aliments ? Si vous avez des réserves à émettre précisez-les.

……………………………………………………………………………………………………………………………………………………………

……………………………………………………………………………………………………………………………………………………………

……………………………………………………………………………………………………………………………………………………………

……………………………………………………………………………………………………………………………………………………………

……………………………………………………………………………………………………………………………………………………………

……………………………………………………………………………………………………………………………………………………………

Aide :

Vous devriez obtenir un graphique similaire à celui-ci :

Page 7: TD Analyse de données pour l’évaluation de l ... · - Appende à faie un calcul d’exposition ... Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu, créez

UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 7

Question 5 :

- En suivant la même méthode, calculez l’exposition de la population de l’ENQ1 au plomb pour le groupe

d’aliments produits laitiers.

- Quelles sont vos conclusions quant à l’exposition de cette population au plomb pour ces deux groupes

d’aliments ? Si vous avez des réserves à émettre précisez-les.

……………………………………………………………………………………………………………………………………………………………

……………………………………………………………………………………………………………………………………………………………

……………………………………………………………………………………………………………………………………………………………

………………………………………………………………………………………………………………………………………………………

- Pouvez-vous conclure de la même manière pour le groupe d’aliments Crustacés et mollusques et le

groupe d’aliments produits laitiers ? Justifiez votre réponse.

……………………………………………………………………………………………………………………………………………………………

……………………………………………………………………………………………………………………………………………………………

……………………………………………………………………………………………………………………………………………………………

……………………………………………………………………………………………………………………………………………………………

…………………………………………………………………………………………………………………………………………………………

Ce que vous devez rendre à la fin du TD 1

Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu/dossier_de_votre_binome,

créez un dossier TD1. Ajoutez dans ce dossier le fichier Excel calcul_exposition_plomb.xls contenant vos

réponses.

Page 8: TD Analyse de données pour l’évaluation de l ... · - Appende à faie un calcul d’exposition ... Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu, créez

UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 8

3 TD 2 – Analyser et préparer les données de consommation

De nombreuses sources de données permettent de connaitre la consommation alimentaire d’une population.

Il est important de caractériser la population considérée dans l’enquête choisie pour mener un calcul

d’exposition afin d’être en mesure d’interpréter correctement les résultats obtenus.

Où trouver les données pour le TD ?

L’ensemble des fichiers nécessaires pour le TD 2 se trouvent sur le lecteur réseau TD dans le dossier

UC_Risque_Analyse_Donnees/TD2.

FAITES UNE COPIE DE CE DOSSIER SUR VOTRE ESPACE DISQUE N:/

3.1 Caractérisation des consommateurs

Dans cette partie, nous allons travailler sur le fichier ENQ_1_consommateur.xls situé dans le dossier

caracterisation_consommateur. Ce fichier présente certaines caractéristiques sociodémographiques des

individus ayant répondus à une enquête de consommation individuelle que nous nommerons ENQ1. Le

tableau ci-dessous décrit les champs de ce fichier.

Description des champs du fichier ENQ_1_consommateur.xls

Nom du champ Description

identi Identifiant de la personne ayant répondu à l’enquête

libelle_sexe Sexe de la personne ayant répondu à l’enquête

age Age de la personne ayant répondu à l’enquête

est_enceinte Indique si la personne considérée était enceinte ou non au moment où elle a répondu à l’enquête

libelle_region Région d’habitation de la personne ayant répondu à l’enquête

Question 1 :

- Représentez la répartition par âge de la population à l’aide d’un tableau croisé dynamique puis d’un

histogramme.

- Combien de classes d’individus obtenez-vous ? …………………………………………………………………………………

Ce chiffre vous parait-il adapté à un calcul d’exposition ? En d’autres termes, compte tenu des classes

d’individus obtenues, pensez-vous pouvoir identifier les tranches d’âges potentiellement à risque ?

……………………………………………………………………………………………………………………………………………………………

……………………………………..……………………………………………………………………………………………………………………

- À partir du tableau croisé dynamique construit précédemment, créez des groupes individus plus

appropriés à l’analyse des futurs résultats des calculs d’exposition.

Page 9: TD Analyse de données pour l’évaluation de l ... · - Appende à faie un calcul d’exposition ... Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu, créez

UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 9

- Qu’en concluez-vous quant à la représentativité de la population ?

……………………………………………………………………………………………………………………………………………………………

…………………………………………………………………………………………………………………………………………………………..

…………………………………………………………………………………………………………………………………………………………..

…………………………………………………………………………………………………………………………………………………………..

Aide :

Pour répondre à cette question, vous pouvez utiliser la fonction Groupes et créer un plan disponible à partir

du tableau croisé dynamique.

- Faites un clic-droit avec la souris sur le champ du tableau croisé que vous souhaitez grouper.

- Un menu contextuel s’ouvre. Choisissez alors Grouper et créer un plan puis Grouper.

- Une fenêtre apparait alors vous permettant de définir vos groupes

- Après avoir validé en cliquant sur OK, votre tableau croisé dynamique est mis à jour en prenant en

compte les paramètres saisis.

Début : 1ère valeur à prendre

en compte. Elle fera donc

partie du 1er groupe.

Fin : Dernière valeur à

prendre en compte. Elle fera

donc partie du dernier

groupe

Par : Le chiffre qui

représente l’intervalle pour

chaque groupe

Page 10: TD Analyse de données pour l’évaluation de l ... · - Appende à faie un calcul d’exposition ... Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu, créez

UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 10

Question 2 :

- En suivant la même démarche que pour la question 1, caractérisez la population de l’enquête ENQ1

en utilisant la région d’habitation et le sexe des personnes ayant répondu.

- Si besoin, créez des groupes plus appropriés à l’analyse des futurs résultats des calculs d’exposition.

- Qu’en concluez-vous quant à la représentativité de la population ?

…………………………………………………………………………………………………………………………………………………………..…

………………………………………………………………………………………………………………………………………………………..……

……………………………………………………………………………………………………………………………………………………..………

…………………………………………………………………………………………………………………………………………………..…………

………………………………………………………………………………………………………………………………………………..

3.2 Caractérisation des consommations

L’exposition globale d’un individu est fonction de son panier de consommation : les populations les plus

consommatrices sont les plus exposées. Dans cette partie, nous allons travailler sur le fichier

ENQ_1_conso_semaine.xls situé dans le dossier TD2/caracterisation_consommation. Ce fichier décrit les

consommations des individus ayant répondu à l’enquête de consommation ENQ1. Les consommations ont été

sommées par groupe d’aliments et divisées par le poids de l’individu.

Description des champs du fichier ENQ_1_conso_semaine.xls

Nom du champ Description

identi Identifiant de la personne ayant répondu à l’enquête

libellegroupe Libellé du groupe aliments consommés

SommeDeqte Sommes des quantités consommées divisées par le poids de l’individu

libelle_sexe Sexe de la personne ayant répondu à l’enquête

age Age de la personne ayant répondu à l’enquête

est_enceinte Indique si la personne considérée était enceinte ou non au moment où elle a répondu à l’enquête

libelle_region Région d’habitation de la personne ayant répondu à l’enquête

Question 1 :

- Représentez dans un graphique les consommations en chacun des groupes de produits ? Selon vous,

quel(s) groupe(s) d’aliments vous semble(nt) intéressants à analyser plus précisément ?

.........................................................................................................................................………………………

…………………………………………………………………………………………………………………………………..………………………

…………………………………………………………………………………………………………………………………..………………………

…………………………………………………………………………………………………………………………………..

Page 11: TD Analyse de données pour l’évaluation de l ... · - Appende à faie un calcul d’exposition ... Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu, créez

UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 11

Question 2 :

- Représentez dans un tableau croisé dynamique, la somme des consommations d’abats selon l’âge des

individus. Créez des groupes d’âges avec des intervalles de 10 ans.

- Une fois ce tableau croisé créé, représentez le sous forme de graphique.

- Pouvez-vous tirer une conclusion concernant l’âge des forts consommateurs ?

…………………………………………………………………………………………………………………………………………………………..

……………………………………………………………………………………………………………………………………………………………

………………………………………………………………………………………………….…………………………..

- Est-ce que cette observation est de nature à vous faire remettre en cause ou nuancer vos conclusions

du TD 1 ?

....................................................................................................................................................

…………………………………………………………………………………………………………………………………………………………..

…………………………………………………………………………………………………………………………………………………………..

Question 3 : l’objectif de cette question est de représenter les distributions des consommations. Nous allons

travailler sur le groupe aliments Abats.

- Représentez dans un tableau croisé dynamique, la somme des consommations en Abats de chaque

individu. Pour faciliter la suite de cet exercice, nommez tableau_abats la feuille contenant ce tableau.

Vous placerez dans le tableau croisé dynamique :

o la variable libellegroupe dans la zone champ de page ;

o la variable identi dans la zone champ de ligne.

- Notez que vous n’avez que les consommateurs d’Abats dans votre tableau. Faites apparaitre les non-

consommateurs en prenant soin que la quantité affichée dans le tableau soit 0 pour ces non

consommateurs.

- Pour calculer des fréquences, la première étape est de créer une colonne contenant les seuils des

intervalles de fréquence.

- Dans la feuille tableau_abats, créer une colonne Intervalles contenant les valeurs suivantes : 0, 2, 4,

6, 8, 10, 12, 14, 16, 18, 20. Placez cette colonne de valeur en dehors du tableau croisé.

Aide :

Pour créer ce tableau croisé, vous devez déposer la variable libellegroupe dans la zone champ de page du

tableau croisé dynamique.

Page 12: TD Analyse de données pour l’évaluation de l ... · - Appende à faie un calcul d’exposition ... Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu, créez

UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 12

- À côté de la colonne Intervalles, créez une colonne Fréquences. Placez cette colonne de valeur en

dehors du tableau croisé.

- Calculez les fréquences correspondantes à chacun des intervalles et ajoutez les dans la colonne

Fréquence.

Aide :

Vous devez obtenir les colonnes suivantes :

Nombre de résultats inférieurs ou égaux à 0

Nombre de résultats inférieurs ou égaux à 5

Nombre de résultats inférieurs ou égaux à 10

Nombre de résultats inférieurs ou égaux à 15

Nombre de résultats inférieurs ou égaux à 20

Aide :

Pour calculer les fréquences, il faut utiliser la fonction Excel FREQUENCE.

- Sélectionnez la cellule correspondant au premier intervalle dans la colonne Fréquences.

- Allez dans le menu Insertion puis choisissez Fonction.

Page 13: TD Analyse de données pour l’évaluation de l ... · - Appende à faie un calcul d’exposition ... Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu, créez

UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 13

- Une fenêtre s’ouvre alors. Cherchez et sélectionnez la fonction FREQUENCE puis cliquez sur le

bouton OK

- Il faut maintenant paramétrer la fonction FREQUENCE en remplissant ses champs :

o Dans Tableau_données, indiquez les plages de cellules correspondant aux quantités

consommées ;

o Dans Matrice_intervalles, indiquez les plages de cellules correspondant aux intervalles de

fréquences créés précédemment.

- Utilisez le bouton situé à côté de chacun des champs pour pouvoir utiliser la souris et

sélectionner les plages de cellules adéquates. Lorsque vous avez terminé, cliquez sur le bouton

pour revenir à la fenêtre de la fonction FREQUENCE.

- Une fois les 2 champs remplis, cliquez sur OK. Vous devez obtenir le calcul de la fréquence pour le

premier intervalle.

Page 14: TD Analyse de données pour l’évaluation de l ... · - Appende à faie un calcul d’exposition ... Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu, créez

UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 14

- Pouvez-vous tirer une conclusion concernant les forts consommateurs ?

……………………………………………………………………………………………………………………………………………………………

………………………………………………………………………………………………………………………………………………………..…

…………………………………………………………………………………………………………………………………………………………

- Est-ce que cette observation est de nature à vous faire remettre en cause ou nuancer vos conclusions

du TD 1 ?

............................................................................................................................................................……

……………………………………………………………………………………………………………………………………………………………

……………………………………………………………………………………………………………………………………………………………

……………………………………………………………………………………………………………………………………………………………

Ce que vous devez rendre à la fin du TD 2

Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu/dossier_de_votre_binome,

créez un dossier TD2. Ajoutez dans ce dossier les fichiers Excel contenant vos réponses. :

- ENQ_1_consommateur.xls

- ENQ_1_conso_semaine.xls

- Il faut maintenant propager la fonction sur les autres intervalles de fréquences.

- Sélectionnez l’ensemble des cellules dans lesquelles il faut propager le calcul de la fréquence

- Tout en gardant ces cellules sélectionnées, appuyez sur la touche F2 puis sur CTRL+MAJ+ENTRÉE.

- Vous devez maintenant avoir une fréquence en face de chaque intervalle.

Page 15: TD Analyse de données pour l’évaluation de l ... · - Appende à faie un calcul d’exposition ... Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu, créez

UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 15

4 TD 3 – Analyser et préparer les données de contamination

Certaines méthodes statistiques (notamment les approches probabilistes) sont sensibles à la qualité et la

quantité des données disponibles. Pour pouvoir choisir la méthode de calcul adaptée, il est donc essentiel de

caractériser ses données.

Où trouver les données pour le TD ?

L’ensemble des fichiers nécessaires pour le TD 3 se trouvent sur le lecteur réseau TD dans le dossier

UC_Risque_Analyse_Donnees/TD3.

FAITES UNE COPIE DE CE DOSSIER SUR VOTRE ESPACE DISQUE N:/

4.1 Caractérisation des données de contamination

Dans cette partie, nous allons travailler sur le fichier mesure_plomb.xls. Ce fichier présente les teneurs en

plomb mesurées dans différents aliments. Ces données de contamination se présentent sous la forme de listes

de mesures de contamination organisées en groupe d’aliments. Le tableau ci-dessous décrit les champs de ce

fichier.

Description des champs du fichier mesure_plomb.xls

Nom du champ Description

id_mesure Identifiant de la mesure

id_contaminant Identifiant du contaminant

nom_contaminant Nom du contaminant

id_aliment Identifiant de l’aliment analysé

nom_aliment Nom de l’aliment analysé

id_groupe_aliment Identifiant du groupe aliment

nom_groupe_aliment Nom du groupe aliment

id_laboratoire Identifiant du laboratoire ayant effectué les analyses

unite_mesure Unité de la mesure effectuée

quantite_numerique Quantité de contaminant retrouvé dans l’aliment analysé. Cette valeur est renseignée si la teneur en contaminant dans l’aliment analysé était supérieure à la LOQ. Sinon les 2 colonnes signe_quantite_imprecise et quantite_imprecise_valeur sont renseignées

signe_quantite_imprecise Signe de l’imprécision dans la mesure de contamination. Cette colonne est renseignée si la mesure est inférieure à la LOQ ou la LOD. De plus, la colonne quantite_imprecise_valeur est aussi renseignée.

quantite_imprecise_valeur Quantité imprécise de contaminant retrouvé dans l’aliment analysé. Cette valeur est renseignée si la mesure est inférieure à la LOD ou la LOQ.

loq La limite de quantification associée à la mesure

lod La limite de détection associée à la mesure

Page 16: TD Analyse de données pour l’évaluation de l ... · - Appende à faie un calcul d’exposition ... Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu, créez

UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 16

Question 1 :

- Calculez le nombre de mesures disponibles par groupe d’aliments.

- Faites un histogramme représentant les résultats.

- Quelles conclusions en tirez-vous sur les calculs et leurs futures interprétations ?

..................................................................................................................................................................

..................................................................................................................................................................

..................................................................................................................................................................

Question 2 :

- Quel est le pourcentage d’échantillons supérieurs à la limite de détection ? Calculez ce pourcentage

sur l’ensemble des données disponibles et par groupes d’aliments

..................................................................................................................................................................

..................................................................................................................................................................

- Faites un histogramme représentant les résultats. Ajoutez une série sur ce graphique pour visualiser

les groupes présentant plus de 50% de données censurées.

Quelles conclusions en tirez-vous sur les calculs effectués dans le TD 1 et leurs interprétations ?

..................................................................................................................................................................

..................................................................................................................................................................

..................................................................................................................................................................

- Quelles conclusions en tirez-vous quant aux consommations et aux groupes d’aliments intéressants à

analyser ?

..................................................................................................................................................................

..................................................................................................................................................................

..................................................................................................................................................................

4.2 Choix du traitement de la censure

Nous allons maintenant traiter la censure c’est-à-dire remplacer les valeurs du type « < LOD » ou « < LOQ »

par une valeur précise. L’objectif est au final de remplacer les 2 colonnes quantite_numerique et

quantite_imprecise_valeur par une seule colonne que nous appellerons teneur_plomb contenant une valeur

précise de contamination pour chaque mesure effectuée sur le plomb. Pour cela, nous allons remplacer la

mesure censurée par la LOD ou la LOQ multipliée par un coefficient.

Question 3 : Mettez en œuvre les 3 scénarios suivant :

- Scénario 1 :

Pour chaque mesure de contamination :

- si une valeur existe dans la colonne quantite_numerique, on la copie dans la colonne teneur_plomb

- si une valeur existe dans la colonne quantite_imprecise_valeur, on applique l’une des 2 formules

suivantes :

o Si mesure < LOD, remplacer par α LOD avec α = 0

o Si mesure < LOQ, remplacer par β LOQ avec β = 0

Page 17: TD Analyse de données pour l’évaluation de l ... · - Appende à faie un calcul d’exposition ... Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu, créez

UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 17

- Scénario 2 :

Pour chaque mesure de contamination :

- si une valeur existe dans la colonne quantite_numerique, on la copie dans la colonne teneur_plomb

- si une valeur existe dans la colonne quantite_imprecise_valeur, on applique l’une des 2 formules

suivantes :

o Si mesure < LOD, remplacer par α LOD avec α = 1

o Si mesure < LOQ, remplacer par β LOQ avec β = 1

- Scénario 3 :

Pour chaque mesure de contamination :

- si une valeur existe dans la colonne quantite_numerique, on la copie dans la colonne teneur_plomb

- si une valeur existe dans la colonne quantite_imprecise_valeur, on applique l’une des 2 formules

suivantes :

o Si mesure < LOD, remplacer par α LOD avec α = 0.5

o Si mesure < LOQ, remplacer par α LOD + β LOQ avec α = 0.5 et β = 0.5

Créez une colonne teneur_plomb pour chaque scénario et appliquez le scénario correspondant c’est-à-dire

remplacer les valeurs censurées par des valeurs précises pour n’avoir plus qu’une seule colonne contenant

des valeurs précises de contamination pour chaque mesure effectuée sur le plomb.

A la fin, vous devez donc avoir une colonne teneur_plomb_1 pour le scénario 1, teneur_plomb_2 pour le

scénario 2 et teneur_plomb_3 pour le scénario 3.

Aide :

Pour répondre à cette question, vous pouvez utiliser les fonctions :

- SI ()

- ESTVIDE ()

N’hésitez pas à faire des transformations intermédiaires si nécessaires.

Page 18: TD Analyse de données pour l’évaluation de l ... · - Appende à faie un calcul d’exposition ... Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu, créez

UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 18

4.3 Agrégation des mesures de contamination

Après avoir traité la censure, il faut maintenant agréger les mesures de contamination c’est-à-dire nous

ramener à une mesure de contamination pour chaque groupe d’aliments en appliquant une des méthodes

d’agrégation suivante :

- Moyenne : on prend la moyenne de la liste des mesures de contamination ;

- Maximum : on prend le maximum de la liste des mesures de contamination.

Question 4 : Pour chacun des 3 scénarios réalisés précédemment, agrégez les mesures de contamination pour

chaque groupe d’aliments en utilisant les 2 méthodes moyenne, maximum. En d’autres termes, pour chacun

des 3 scénarios, vous devez obtenir un tableau sur le modèle de celui-ci :

Nom groupe Moyenne Maximum

Groupe 1

Groupe 2

Etc…

Question 5 : Proposez une/des représentation(s) graphique(s) permettant de visualiser pour chaque groupe

d’aliments les différentes moyenne obtenues selon les 3 scénarios.

- Faites la même chose avec le maximum.

Quelles conclusions en tirez-vous ? Quelles peuvent être les conséquences sur le calcul ?

..................................................................................................................................................................

..................................................................................................................................................................

..................................................................................................................................................................

Est-il pertinent de faire plusieurs calculs d’exposition se basant sur les 3 scénarios ? Justifiez votre

réponse.

..................................................................................................................................................................

..................................................................................................................................................................

..................................................................................................................................................................

Aide :

Il pourrait être pertinent de faire plusieurs graphiques représentant les moyennes/maximum élevés d’une

part et les moyennes/maximum faibles d’autre part.

Page 19: TD Analyse de données pour l’évaluation de l ... · - Appende à faie un calcul d’exposition ... Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu, créez

UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 19

Question 6 : Représentez pour le scénario 1 sur un même graphique la moyenne et le maximum des mesures

de contamination pour chaque groupe d’aliments.

- Faites la même chose pour les scénarii 2 et 3.

Quelles conclusions en tirez-vous ? Quelles peuvent être les conséquences sur le calcul ?

..................................................................................................................................................................

..................................................................................................................................................................

..................................................................................................................................................................

- Est-il pertinent de faire plusieurs calculs d’exposition utilisant la moyenne et le maximum des mesures

de contamination ? Justifiez votre réponse.

..................................................................................................................................................................

..................................................................................................................................................................

..................................................................................................................................................................

Ce que vous devez rendre à la fin du TD 3

Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu/dossier_de_votre_binome,

créez un dossier TD3. Ajoutez dans ce dossier le fichier Excel mesure_plomb.xls contenant vos réponses.

Bonus : S’il vous reste du temps……

- Réalisez le TD1 en utilisant cette fois les données disponibles dans la feuille

matrice_consommation_ENQ2.

- Reprenez le TD2 avec le fichier ENQ_2_consommateur.xls situé dans le dossier

caracterisation_consommateur. Ce fichier présente certaines caractéristiques sociodémographiques

des individus ayant répondus à une enquête de consommation individuelle que nous nommerons

ENQ2. Le tableau ci-dessous décrit les champs de ce fichier. Nous supposerons que cette enquête

ENQ2 a eu lieu 5 ans après l’enquête ENQ1.

Description des champs du fichier ENQ_2_consommateur.xls

Nom du champ Description

nomen Identifiant de la personne ayant répondu à l’enquête

age Age de la personne ayant répondu à l’enquête

sexe Sexe de la personne ayant répondu à l’enquête

reg Région d’habitation de la personne ayant répondu à l’enquête

enceinte Indique si la personne considérée était enceinte ou non au moment où elle a répondu à l’enquête

Page 20: TD Analyse de données pour l’évaluation de l ... · - Appende à faie un calcul d’exposition ... Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu, créez

UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 20

- Comparer vos résultats avec ceux que vous avez obtenus pour l’ENQ1.

- Reprenez le TD2 avec le fichier ENQ_2_conso_semaine.xls situé dans le dossier

caracterisation_consommation. Ce fichier décrit les consommations des individus ayant répondu à

l’enquête de consommation ENQ2. Les consommations ont été sommées par groupe d’aliments et

divisées par le poids de l’individu.

Description des champs du fichier ENQ_2_consommateur.xls

Nom du champ Description

nomen Identifiant de la personne ayant répondu à l’enquête

libgr Libellé du groupe aliment consommés

SommeDeqte Sommes des quantités consommées divisées par le poids de l’individu

age Age de la personne ayant répondu à l’enquête

sexe Sexe de la personne ayant répondu à l’enquête

reg Région d’habitation de la personne ayant répondu à l’enquête

enceinte Indique si la personne considérée était enceinte ou non au moment où elle a répondu à l’enquête

- Comparer vos résultats avec ceux que vous avez obtenus pour l’ENQ1.

Ce que vous devez rendre à la fin du Bonus

Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu/dossier_de_votre_binome,

créez un dossier Bonus. Ajoutez dans ce dossier les fichiers Excel contenant vos réponses.