16 Travail sur un tableau de contingence - Test du khi-2
... façons : tableau de contingence (c'est généralement le cas lorsque les
données sont issues d'un exercice de TD), ou tableau du protocole (par exemple,
vous avez saisi les réponses que vous avez recueillies à un questionnaire).
Nous allons donc étudier comment réaliser un test du khi-2 dans chacun de ces
deux cas.
Part of the document
Licence de Psychologie - Semestre N° 5 - TD n° 3
Test du khi-2 - Tests statistiques non paramétriques
Travail sur un tableau de contingence - Test du khi-2
1 Enoncé Une étude a été menée en 1990-91 sur les facteurs pouvant influer sur le
port de la ceinture de sécurité par les conducteurs et les passagers de
voitures de tourisme et de véhicules utilitaires. De nombreuses
observations ont été effectuées (9434 au total), et ont donné lieu au
relevé des éléments suivants :
- Nature du véhicule (voiture de tourisme / véhicule utilitaire) - Age du conducteur (trois classes d'âge) - Sexe (M / F) - Port de la ceinture (port / non port) - Présence d'un passager avant (oui / non) - Le cas échéant, âge, sexe et port de la ceinture pour le passager - Présence de passagers arrière (oui / non) On s'intéresse tout d'abord à l'effet du type d'occupation du véhicule
(conducteur seul, conducteur + passagers avant, conducteur + passagers
arrière, conducteur + passagers avant et arrière) sur le port de la
ceinture par le conducteur. On dispose de 8374 observations concernant
cette partie de l'étude. Les données sont les suivantes : | |Port ceinture |non port de |
| | |ceinture |
|Seul |2825 |3468 |
|Cond. + pass. |729 |815 |
|avant | | |
|Cond. + pass. |80 |113 |
|arrière | | |
|Cond. + pass. av. |168 |176 |
|et arr. | | | On souhaite en particulier tester l'existence d'un lien entre les deux
variables "Type d'occupation" et "Port de la ceinture" à l'aide d'un test
du khi-2.
2 Mise en oeuvre du test du khi-2 Nous pouvons être amenés à réaliser un test du khi-2 sur des données
structurées de différentes façons : tableau de contingence (c'est
généralement le cas lorsque les données sont issues d'un exercice de TD),
ou tableau du protocole (par exemple, vous avez saisi les réponses que vous
avez recueillies à un questionnaire). Nous allons donc étudier comment
réaliser un test du khi-2 dans chacun de ces deux cas. 1 Le test du khi-2 à partir d'un tableau protocole En général, une ligne d'une feuille de données statistiques correspond à
une observation. Autrement dit, nous devons ici avoir 8374 lignes du type
suivant : |N° obs |Type |Port |
| |d'occupation |ceinture |
|1 |Seul |Oui |
|2 |Seul |Oui |
|... |... |... |
|8374 |Cond. + pass. |Non |
| |av. et arr. | | Chargez R, puis R Commander et importez le classeur Ceinture.xls comme jeu
de données. Sauvegardez-le au format RData sous le nom Ceinture.RData
Utilisez le menu Statistiques - Tables de Contingence - Tableau à double
entrée. S'affiche alors la fenêtre de dialogue suivante : [pic] L'application de la méthode produit plusieurs résultats. - R construit d'abord un tableau de contingence à partir des données
fournies : > .Table .Table
Port.ceinture
Occupation Non Oui
Arrière 113 80
Avant 815 729
Avant et arrière 176 168
Seul 3468 2825 On peut ainsi vérifier que les données du fichier Ceinture.xls
correspondent à l'énoncé ci-dessus; - R calcule ensuite la statistique du khi-2 sur ce tableau de contingence
et nous renvoie la valeur du khi-2 ((² = 5,5631) ainsi que son niveau de
significativité (p=0,1349): > .Test .Test
Pearson's Chi-squared test
data: .Table
X-squared = 5.5631, df = 3, p-value = 0.1349 Lecture du résultat. Le niveau de significativité (p=0,1349=13,5%) indique
qu'on ne peut pas rejeter l'hypothèse d'une indépendance entre le mode
d'occupation du véhicule et le fait, pour le conducteur de porter la
ceinture ou non. 2 Le test du khi-2 à partir d'un tableau de contingence On peut aussi fournir à R Commander un tableau de contingence. Pour cela,
on utilise le menu Statistiques - Tables de Contingence - Remplir et
analyser un tableau à double entrée... On spécifie tout d'abord les dimensions du tableau, puis on indique les
effectifs correspondant aux combinaisons de modalités. L'ordre dans lequel
sont prises les différentes modalités est sans importance : [pic] On obtient les résultats suivants : > .Table rownames(.Table) colnames(.Table) .Table # Counts
1 2
1 2825 3468
2 729 815
3 80 113
4 168 176
On obtient ensuite le résultat du test du khi-2, identique à celui obtenu
précédemment :
> .Test .Test
Pearson's Chi-squared test
data: .Table
X-squared = 5.5631, df = 3, p-value = 0.1349
Enfin, comme nous avions cochez la boîte "Composants de la statistique du
Chi-deux", R nous indique les contributions des différentes cases du
tableau au khi-deux :
> round(.Test$residuals^2, 2) # Chi-square Components
1 2
1 0.36 0.30
2 1.12 0.93
3 0.66 0.55
4 0.89 0.74
On peut remarquer que les données saisies sous forme de tableau de
contingence ne sont pas mémorisées par R, mais seulement utilisées pour le
calcul immédiat du khi-deux.
3 Exercice : 1) On s'intéresse, pour les conducteurs non accompagnés, au lien entre le
sexe et le port de la ceinture. Les données sont les suivantes :
| |Port ceinture |non port de |
| | |ceinture |
|Homme |1981 |2647 |
|Femme |844 |821 | Réalisez un test du khi-2 pour déterminer si le port de la ceinture par le
conducteur dépend ou non du sexe du conducteur. 2) On se limite ici aux véhicules dans lesquels se trouvaient des
passagers. On s'intéresse d'une part au port de la ceinture par la paire
conducteur/passager avant et d'autre part au type de véhicule. Les données
sont les suivantes :
| |Véh. de |Véh. utilitaire |
| |tourisme | |
|Cond. sans ceint.,|199 |11 |
|pass avec ceint. | | |
|Cond. et pass. |596 |111 |
|sans ceinture | | |
|Cond. et pass. |549 |24 |
|avec ceinture | | |
|Cond. avec |161 |10 |
|ceinture, pass. | | |
|sans ceinture | | | Réalisez un test du khi-2 pour déterminer si les variables "comportement
des occupants vis-à-vis du port de la ceinture" et "nature du véhicule"
sont indépendantes ou non.
Tests non paramétriques sur deux groupes indépendants 1 Test de la médiane
Nurcombe et al. ont mené en 1984 une étude sur les enfants présentant un
poids réduit à la naissance (PRN). Ces enfants posent des problèmes
particuliers à leurs parents parce qu'ils sont, en apparence, apathiques et
imprévisibles; en outre, ils risquent de connaître des problèmes physiques
et comportementaux. L'étude a porté sur trois groupes d'enfants ; - Un groupe expérimental de 25 enfants PRN dont les mères bénéficiaient
d'un apprentissage particulier : elles étaient sensibilisées aux signaux
émis par ces enfants, afin de leur permettre de mieux répondre à leurs
besoins ;
- Un groupe témoin de 31 enfants PRN dont les mères ne bénéficiaient
d'aucun programme particulier ;
- Un groupe d'enfants dont le poids à la naissance était normal. La feuille de données du classeur Excel Enffants-PRN.xls contient une
partie des données. Elle indique l'indice de développement mental (IDM) à 6
mois et à 24 mois pour le groupe témoin PRN et l'IDM à 24 mois pour le
groupe expérimental PRN. Importez le fichier Excel Enfants-PRN.xls comme jeu de données, qui sera
nommé Enfants.PRN. On veut comparer l'IDM à 24 mois dans le groupe témoin et dans le groupe
expérimental à l'aide d'un test de la médiane.
Rappel de la méthode : on construit un tableau de contingence en croisant
les variables "Groupe" et "Position par rapport à la médiane" et on réalise
un test du khi-deux sur le tableau de contingence obtenu.
En utilisant, par exemple, le menu Statistiques - Résumés - Statistiques
descriptives..., vérifiez que la médiane des IDM à 24 mois est égale à
111,5. Le test de la médiane n'est pas directement disponible dans R Commander,
mais il est assez simple de se ramener à un test du khi-2 en utilisant la
méthode rappelée ci-dessus. Nous allons donc générer une nouvelle variable, nommée Pos.mediane.IDM24,
qui contiendra la position par rapport à la médiane pour chacune des
observations de IDM.24, puis nous ferons un test du khi-2. Utilisez le menu Données - Gérer des variables dans le jeu de données actif
- Découper une variable numérique en classes... Indiquez un découpage en
deux classes de même effectif et veillez à ce que l