EXTRAITS DES PROGRAMMES - Mathématiques dans l'académie ...

Etude du cas général (1 < r < N) : ... 2°) On revient au cas général : m ? 2. ..... p d'
avoir un caractère génétique bien défini, et ceci de façon indépendante.

Part of the document


TESTS DE DÉPISTAGE


La formule des probabilités totales est au programme des classes de
terminales ES et S. Elle apparaissait déjà explicitement en série ES ; ce
sont les modalités de mise en ?uvre, aussi bien en série ES qu'en série S,
qui présentent un caractère de nouveauté.
On peut lire notamment :
En terminale ES : On appliquera cette formule à la problématique des tests
de dépistage.
En terminale S : Application à la problématique des tests de dépistage en
médecine et à la loi de l'équilibre génétique lors d´appariements au
hasard.

Le document qui suit est en grande partie le produit du groupe de travail
« Statistique et probabilités » mis en place par les IPR pour préparer les
journées d'information sur les programmes de terminales ES et S. Il
s'appuie sur le travail de Sandrine Beauseigneur et Arnaud Bessière (lycée
Jules Verne à Cergy), d'Annie Soismier (lycée P. E. Victor à Osny) et
Gérard Tartary (lycée Alain Le Vésinet), et reprend l'essentiel de l'exposé
d'Arnaud Bessières, lors du la réunion au lycée Pissarro à Pontoise en juin
2002. Il renvoie aussi aux documents d'accompagnements des programmes et à
la conférence de Jean-Louis Piednoir, Inspecteur général de mathématiques,
professeur à l'ENSAE, sur les statistiques bayesiennes le 27 septembre 2002
au lycée La Bruyère à Versailles.
TESTS DE DÉPISTAGE


Pour diagnostiquer une maladie ou dépister un caractère, chez des personnes
ou des animaux, on utilise des tests cliniques ou biologiques.


Il y a deux phases dans l'élaboration d'un test :

- phase d'étalonnage à l'aide d'un groupe témoin constitué de
personnes ou d'animaux (que nous qualifierons de sujets) dont on
connaît le caractère (par exemple, avoir ou non la maladie)
- phase d'utilisation où l'on applique ce test pour détecter la
maladie.

Pour simplifier, par la suite, on notera : T : « le test est positif » et
M : « le sujet est malade ». On cherche à établir un lien entre ces deux
événements.

Dans la phase d'étalonnage du test, on s'intéresse à deux indices : la
probabilité d'avoir un test positif sachant le sujet est malade et la
probabilité que le test soit négatif sachant que le sujet n'est pas malade.
Selon certains auteurs, on parle de :
- la sensibilité du test : [pic], encore notée [pic]
- la spécificité du test : [pic], encore notée [pic]


Ces indices sont indépendants de la probabilité a priori d'être malade,
souvent appelée prévalence de la maladie dans la population étudiée. Pour
que le test soit fiable, les valeurs de [pic]et [pic]doivent être les plus
proches possible de un. Cependant il ne faut pas perdre de vue que ces deux
probabilités sont déterminées à partir de statistiques, ce qui peut poser
problème.

Dans la phase d'utilisation du test, on cherche à détecter les personnes
malades. La difficulté est que le test peut être positif à tort (le test
est positif alors que la personne n'est pas malade) ou négatif à tort (le
test est négatif alors que la personne est malade).

Le clinicien qui désire poser un diagnostic peut s'intéresser, entre
autres, à deux paramètres :
- la valeur prédictive positive :
[pic], encore notée[pic]
- la valeur prédictive négative :
[pic], encore notée [pic]



On a accès aux probabilités [pic] et [pic] « inverses » des probabilités
précédentes, [pic] et [pic], en utilisant la formule des probabilités
totales :


[pic]

d'où l'on tire :
[pic]
et en utilisant les relations :
[pic] [pic]
on retrouve l'expression donnée par le théorème de Bayes :

[pic]

Cependant, concrètement, les probabilités qui interviennent dans cette
formule sont estimées à partir de statistiques. Il y a lieu de s'assurer
que le modèle qui en résulte est adapté à la population étudiée (dans sa
conférence, Jean-Louis Piednoir évoque cette question)

En remplaçant [pic] par [pic], [pic] par [pic], [pic]par [pic]et [pic]par
[pic]on obtient :
[pic]

On obtiendrait de même :
[pic]

On remarque que, contrairement à [pic] et [pic], les valeurs prédictives
VPP et VPN dépendent de la probabilité a priori d'être malade. On est donc
amené à étudier VPP et VPN en fonction de la variable p(M) (ce point est
développé dans les documents d'accompagnement des programmes de terminale
ES et S, annexe Probabilités et statistique pages 130 à 132)

Par ailleurs, l'efficacité du test peut être mesurée par [pic], que
certains auteurs notent [pic]
[pic]
On peut encore écrire :
[pic]

Bibliographie :
Biostatistique et probabilités - exercices, problèmes et épreuves corrigées
- Collection PCEM - Editions Ellipses.
Eléments de statistique à l'usage des étudiants en médecine et en biologie
- cours et exercices corrigés - Bernard Legras - Editions Ellipses