Analyse Factorielle des Correspondances (AFC) - Jonathan Lenoir

Analyse Factorielle des Correspondances appliquée à des données de ...
dispose d'un nombre important de données, représente un travail long et
fastidieux. .... Le jeu de données est extrait de l'exercice phytoécologique 2006
réalisé par la ...

Part of the document

Analyse Factorielle des Correspondances : application à des données
phytoécologiques
TD
Utilisation du logiciel libre R sur des données de présence/absence issues
de relevés floristiques forestiers
Le but de cette session de Travaux Dirigés est de réaliser l'analyse
factorielle des correspondances (AFC) d'un tableau floristique codé en
présence/absence afin d'avoir une idée de la distribution des espèces et de
la structuration des communautés de végétation spontanée dans le Massif du
Lomont (Jura). On essaiera d'expliquer la variabilité des coordonnées
factorielles des relevés sur les principaux axes factoriels avec des
données écologiques issues du terrain pour avoir une idée des principaux
gradients écologiques responsable de cette variabilité. Table des matières
1 INTRODUCTION A L'AFC D'UN TABLEAU FLORISTIQUE 3 1.1 Pourquoi utilise-t-on l'AFC en phytoécologie ? 3
1.2 Définition et principes : approche phytoécologique 3
1.3 Distinction entre Analyse en Composante Principale (ACP) et AFC en
phytoécologie 5 2 JEU DE DONNEES 6 2.1 Données floristiques 6
2.1.1 Présentation du tableau floristique brut 6
2.1.2 Codage en présence/absence 7
2.2 Données écologiques 7
2.2.1 Localisation 7
2.2.2 Végétation 8
2.2.3 Conditions stationnelles 8
2.2.4 Conditions climatiques 9
2.2.5 Conditions édaphiques 9 3 IMPORT DES DONNÉES DANS LE LOGICIEL LIBRE R 11 3.1 Préparation de votre répertoire de travail dans R 11
3.2 Importation du tableau floristique sur lequel sera réalisé l'AFC 11
3.3 Importation du tableau écologique pour l'interprétation de l'AFC 12 4 AFC DU TABLEAU FLORISTIQUE ET INTERPRETATIONS ECOLOGIQUES 13 4.1 Réalisation de l'AFC 13
4.1.1 Quelques commandes utiles à connaître avant de lancer une AFC
13
4.1.2 Chargement du package ade4 de l'Université Lyon 1 13
4.1.3 Lancement de l'AFC 14
4.1.4 Accéder aux valeurs propres de l'AFC 14
4.1.5 Edition des cartes factoriels 15
4.2 Interprétation de l'AFC 15
4.2.1 Dépouillement de l'axe 1 15
4.2.2 Dépouillement de l'axe 2 16 INTRODUCTION A L'AFC D'UN TABLEAU FLORISTIQUE
1 Pourquoi utilise-t-on l'AFC en phytoécologie ? En phytoécologie, on cherche généralement à mettre en évidence des
associations entre espèces (notion de communautés végétales) ou bien à
faire des groupes écologiques de relevés (notion de typologies de station).
De manière intuitive, cela revient à regrouper les espèces et les relevés
qui se ressemblent, soit en associant les espèces présentent dans les mêmes
relevés, ou bien en regroupant les relevés ayant des profils floristiques
similaires. Effectuer ce travail à la main, dés l'instant où l'on dispose
d'un nombre important de données, représente un travail long et fastidieux.
Le recours à l'outil statistique permet d'automatiser une procédure de tri
par agrégations des espèces qui vont ensemble et des relevés qui se
ressemblent. En ce sens, l'Analyse Factorielle des Correspondances (AFC)
d'un tableau floristique est une méthode semi-automatique permettant de
représenter géométriquement, dans un espace à plusieurs dimensions, les
« distances écologiques » qui séparent les espèces suivant leurs
dispositions dans les relevés ainsi que pour les relevés, suivant la
composition de leurs profils floristiques.
La difficulté associée à cette méthode d'ordination réside dans la
représentation que l'on se fait d'un espace à plusieurs dimensions (autant
que d'espèces ou de relevés). Néanmoins, il est possible de simplifier cet
espace par projection sur une, deux ou trois dimensions afin de mieux
« voir » les distances qui séparent chaque espèce ou chaque relevés. Le jeu
consiste à bien choisir la projection la plus pertinente de cet espace à
plusieurs dimensions dans un espace réduit à un plan, ou un axe, de façon à
résumer au mieux la variabilité, ou inertie du nuage des espèces (resp. des
relevés).
Par analogie, si l'on veut décrire un chameau à quelqu'un qui n'a jamais vu
l'animal, le message le plus explicite sera de dessiner sur le papier une
représentation de profil, c'est le plan factoriel qui décrit le mieux
l'animal en question. L'objectif de l'AFC appliquée au tableau floristique
est identique à celui de vouloir expliquer par le dessin ce que l'on a
retenu de l'allure générale du chameau (simplification de notre réalité
tridimensionnelle sur une feuille de papier plane).
En définitive, l'AFC permet d'analyser un espace multidimensionnel, afin
d'y trouver un axe ou bien un plan dit « factoriel » qui maximise
simultanément la correspondance entre les espèces et les relevés. 2 Définition et principes : approche phytoécologique L'AFC a été conçu au départ comme une méthode de statistique descriptive
destinée à étudier les relations entre deux variables qualitatives à partir
d'un « tableau de contingence ». Cette table de contingence correspond au
croisement des différentes modalités qui composent chacune des deux
variables qualitatives : à chaque case du tableau est affecté l'effectif
des individus présentant les modalités considérées. Par exemple, soit une
variable peuplement à trois modalités, et une variable humus à trois
modalités. On effectue l'AFC sur la table de contingence suivante : | |Moder |Hemimoder |Eumoder |Total |
|Peuplement feuillus|11 |9 |10 |30 |
|Peuplement résineux|13 |10 |7 |30 |
|Mélange |10 |10 |10 |30 |
|feuillus/résineux | | | | |
|Total |34 |29 |27 |90 |
Tableau 1 : Table de contingence Humus/Peuplement Or un tableau floristique n'est pas un tableau de contingence : on parle
plutôt de « tableau disjonctif semi-complet » : chaque case du tableau
contient une information codée en présence/absence pour l'espèce j dans le
relevé i : | |Espèce1 |Espèce2 |Espèce3 |Espèce j |Espèce P |
|Relevé n°1 |0 |1 |1 |... |1 |
|Relevé n°2 |1 |0 |0 |... |0 |
|Relevé n°3 |1 |0 |1 |... |1 |
|Relevé n°i |... |... |... |... |... |
|Relevé n°N |0 |0 |1 |... |1 |
Tableau 2 : Tableau floristique codé en présence/absence Si en phytoécologie, l'objectif de l'AFC est l'étude de la correspondance
entre les espèces, alors il faut attribuer à chaque espèce du tableau
floristique un rôle de variable qualitative à deux modalités (présence ou
absence) et à chaque relevé le rôle d'individu. Par analogie avec l'AFC
classique, cela reviendrait à construire une table de contingence très
complexe sur un nombre important de variables bimodales. Pour retombé dans
le cas de l'AFC classique, il faudrait que sur l'ensemble des relevés
étudiés, le nombre total d'espèces atteigne deux (cas très simple, non
rencontré dans la réalité). Dans ce cas très simplifié, on pourrait
transformer le tableau floristique en une table de contingence du type : | |Espèce1 |Espèce1 |
| |(présence|(absence)|
| |) | |
|Espèce2 |24 |12 |
|(présence)| | |
|Espèce2 |10 |14 |
|(absence) | | |
Tableau 3 : Table de contingence Espèce1/Espèce2 Pour trois espèces, on peut aussi représenter la table de contingence dans
un cube à deux modalités par côté. Au delà de trois, la représentation de
la table de contingence est impossible. Néanmoins, lorsque le nombre de
variables qualitatives est supérieur à deux, il est possible d'effectuer
une AFC non plus sur la table de contingence, mais sur un « tableau
disjonctif complet ». Il s'agit d'effectuer ce que l'on appel un codage
disjonctif des variables. Reprenons l'exemple de l'AFC classique sur les
variables Humus/Peuplement : dans ce cas, chaque variable dispose de trois
modalités. Parmi les 90 relevés issus de l'effectif total, considérons 5
relevés à titre d'exemples et contenant les modalités Humus/Peuplement
suivantes : - R1 : Moder/Résineux
- R2 : Eumoder/Feuillus
- R3 : Moder/Résienux
- R4 : Hemimoder/Résineux
- R5 : Eumoder/Mélange Pour ces 5 relevés, le tableau disjonctif complet correspond à un
éclatement des modalités de chacune des deux variables Humus et Peuplement
en un ensemble de 6 variables binaire (0/1) : | |Moder |Hemimoder |Eumoder |Résineux|Feuillu|Mélange |
| | | | | |s | |
|R1 |1 |0 |0 |1 |0 |0 |
|R2 |0 |0 |1 |0 |1 |0 |
|R3 |1 |0 |0 |1 |0 |0 |
|R4 |0 |1 |0 |1 |0 |0 |
|R5 |0 |0 |1 |0 |0 |1 |
Tableau 4 : Tableau disjonctif complet sur 5 relevés Le résultat de l'AFC sur le tableau disjonctif complet contenant les 90
relevés de l'effectif total donne les mêmes résultats que l'AFC effectué
sur la table de contingence présentée plus haut. Cette représentation
permet cependant de travailler sur un nombre plus grand de variables
qualitatives, autant que d'espèces contenues dans l'ensemble des relevés.
C'est sur la base de ce constat que l'on s'appuie pour dire que l'AFC d'un
tableau floristique correspo