Année académique 2001-2002 : Statistiques : Corrigés de la 1ère ...
Année académique 2001-2002 : Statistiques : Corrigés de la 3ème séance. Série
3 : Les séries de fréquences ... Exercice 3.14. a) Distributions marginales de x ...
Part of the document
Année académique 2001-2002 : Statistiques : Corrigés de la 3ème séance
Série 3 : Les séries de fréquences bivariées : Distributions marginales et
conditionnelles, paramètres descriptifs des distributions, analyse des
liens entre variables
Exercice 3.14
a) Distributions marginales de x et de y + Explication
| |Taille (y) (en m) |
| |1.2( y (1.6 |1.6( y (2 |Total |
|Age |0( x (20 |20 |10 |30 |
|(x) | | | | |
|(en | | | | |
|années| | | | |
|) | | | | |
| |20( x (40 |10 |30 |40 |
| |40( x (60 |0 |20 |20 |
| |60( x (80 |5 |5 |10 |
| |Total |35 |65 |100 |
Distribution marginale de y
La distribution marginale de x est la correspondance entre xj et Fj., où
est Fj. le nombre de fois que la valeur xj de x est observée indépendamment
de la valeur prise par y.
La distribution marginale de y est la correspondance entre yl et F.l, où
est F.l le nombre de fois que la valeur yl de y est observée indépendamment
de la valeur prise par x.
b) Classes modales
La classe modale de la distribution marginale de x est la classe 20( x
(40 ; ce qui signifie que les âges compris entre 20 et 40 ans sont observés
avec la plus grande fréquence.
La classe modale de la distribution marginale de y est la classe 1.6( y
(2 ; ce qui signifie que les tailles comprises entre 1.6m et 2m sont
observés avec la plus grande fréquence.
c) Distribution conditionnelle de x pour 1.2( y (1.6
|Classe |cj |Fj1 |
|0( x (20 |10 |20 |
|20( x (40 |30 |10 |
|40( x (60 |50 |0 |
|60( x (80 |70 |5 |
|Total | |35 |
La distribution conditionnelle de x pour y=y1 (y1 représente la taille
comprise entre 1.2m et 1.6m) est la correspondance entre xj et Fjl où Fj1
est le nombre de fois que la valeur xj de x a été observée pour une valeur
de y = y1.
d) Distribution conditionnelle de x pour 1.6( y (2
|Classe |cj |Fj2 |
|0( x (20 |10 |10 |
|20( x (40 |30 |30 |
|40( x (60 |50 |20 |
|60( x (80 |70 |5 |
|Total | |65 |
Mode :
Classe modale : 20( x (40
Rappel : xmo= emo-1 + ((1 / (1 + (2) amo
où emo-1= borne inférieure de la classe modale
(1 = différence entre l'effectif rectifié de la classe modale et
l'effectif rectifié de la classe précédant la classe modale
(2 = différence entre l'effectif rectifié de la classe modale et
l'effectif rectifié de la classe suivant la classe modale
amo= amplitude de la classe modale
Interpolation linéaire : xmo/y=y2 = 20 + ((30 - 10)/((30 - 10)+(30 - 20)))
. 20 = 33.3333 ans, soit 33 ans.
On en déduit que, parmi 65 personnes qui ont une taille comprise entre 1.6m
et 2m, celles qui ont un âge d'environ 33 ans sont observées avec la plus
grande fréquence.
f) Fréquences de la taille conditionnelles à l'âge
|Fréquences de la taille conditionnelles à l'âge = fl/j. |
| |Taille (y) (en m) |
| |1.2( y (1.6 |1.6( y (2 |Total |
|Age |0( x (20 |0.6667 |0.3333 |1.0 |
|(x) | | | | |
|(en | | | | |
|années| | | | |
|) | | | | |
| |20( x (40 |0.25 |0.75 |1.0 |
| |40( x (60 |0 |1.0 |1.0 |
| |60( x (80 |0.5 |0.5 |1.0 |
Ex. Interprétation : 66,67% des individus qui ont entre 0 et 20 ans
mesurent entre 1.2m et 1.6m.
Fréquences de l'âge conditionnelles à la taille
|Fréquences de l'âge conditionnelles à la |
|taille= fj/.l |
| |Taille (y) (en m) |
| |1.2( y (1.6 |1.6( y (2 |
|Age |0( x (20 |0.5714 |0.1538 |
|(x) | | | |
|(en | | | |
|années| | | |
|) | | | |
| |20( x (40 |0.2857 |0.4616 |
| |40( x (60 |0 |0.3077 |
| |60( x (80 |0.1429 |0.0769 |
| |Total |1.0 |1.0 |
Ex. Interprétation : 57,14% des individus qui mesurent entre 1.2m et 1.6m
ont entre 0 et 20 ans.
g)
g.0) Calcule de l'âge moyen et de la taille moyenne
Age moyen : moyenne des x
Taille moyenne : moyenne des y
(On arrondit donc à 1.7m
g.1) Le centre de gravité, G ; d'une distribution bivariée est le couple (
x , y ).
Il s'agit de la taille et de l'âge moyen de l'ensemble du groupe
(utilisation des distributions marginales et non conditionnelles).
( G = (32 ;1.66)
g.2) La variance des âges de l'ensemble des personnes du groupe
(utilisation des distributions marginales et non conditionnelles)
La variance des tailles de l'ensemble des personnes du groupe
g.3) Les moyennes conditionnelles
Il faut ici utiliser les distributions conditionnelles de x et de y.
On notera qu'il existe autant de moyennes conditionnelles pour x qu'il y a
de valeurs ou (de classes) différentes pour y (puisque la condition porte
sur y !).
De même, il existe autant de moyennes conditionnelles pour y qu'il y a de
valeurs (ou de classes) différentes pour x (puisque la condition porte sur
x !).
( Pour les x
( Pour les y
Les distributions conditionnelles de y sont les suivantes :
| |1.2( y (1.6 |1.6( y (2 |Total |
|cj |1.4 |1.8 | |
|F1l |20 |10 |30 |
|F2l |10 |30 |40 |
|F3l |0 |20 |20 |
|F4l |5 |5 |10 |
| | | |100 |
g.4) Les variances conditionnelles
Pour calculer ces variances conditionnelles, il faut utiliser les moyennes
conditionnelles correspondantes.
( Pour les x
( Pour les y
h) Courbes de régression
Les courbes de régression sont les courbes qui relient les points dont les
coordonnées sont les valeurs de la variables (ou les centres de classe) et
les moyennes conditionnelles correspondantes de l'autre variable.
On obtient ainsi la courbe de régression de y en x (Cy/x) et la courbe de
régression de x en y (Cx/y).
La courbe Cy/x relie les points qui ont pour coordonnées les valeurs de la
variable âge (dans ce cas, les centres de classes) et les tailles moyennes
conditionnelles aux différentes valeurs prises par l'âge.
La courbe Cx/y relie les points qui ont pour coordonnées les valeurs de la
variables taille (dans ce cas, les centres de classes) et les âges moyens
conditionnels aux différents valeurs prises par la taille.
i) Les taux de liaison
1. Calcul des référents théoriques
Fjl = (Fj. ( F.l)/F.. et fjl = (fj. ( f.l)
2. Calcul des taux de liaison
tjl = (Fjl-Fjl)/Fjl = (fjl-fjl)/fjl
Le tableau suivant reprend les effectifs (1ère ligne de chaque case), les
effectifs théoriques (2ème ligne) et les taux de liaison (3ème ligne).
| |Taille (y) (en m) |
| |1.2( y (1.6 |1.6( y (2 |Total |
|Age |0( x (20 |20 |10 |30 |
|(x) | |F11=10.5 |F12=19.5 | |
|(en | |t11= 0.9048 |T12= -0.4872| |
|années| | | | |
|) | | | | |
| |20( x (40 |10 |30 |40 |
| | |F21=14 |F22=26 | |
| | |t21= -0.2857|t22= 0.1538 | |
| |40( x (60 |0 |20 |20 |
| | |F31=7 |F32=13 | |
| | |t31= -1 |t32= 0.5385 | |
| |60( x (80 |5 |5 |10 |
| | |F41=3.5 |F42=6.5 | |
| | |t41= 0.4286 |T42= -0.2308| |
| |Total |35 |65 |100 |
Exemple (pour la première cellule)
Interprétation :
Il y a donc attraction (tjl(0) entre :
- x1 et y1 ;
- x2 et y2 ;
- x3 et y2 ;
- x4 et y1 .
Il y a répulsion (tjl(0) entre :
- x1 et y2 ;
- x2 et y1 ;
- x3 et y1 ;
- x4 et y2 .
( Ce qui signifie : que les âges compris entre 0 et 20 ans sont plus
« attirés » par les tailles comprises entre 1.2m et 1.6m que par les
tailles comprises entre 1.6m et 2m ; etc...
Cela semble logique : ce sont les classes de la population les plus jeunes
et les plus vieilles qui sont plus « attirées » par les tailles les plus
petites.
j) Coefficient de Pearson
Plus les taux de liaison sont dispersés autour de la moyenne (0), plus on
s'éloigne de la situation d'indépendance parfaite.
Calcul de la variance des tjl:
(t² est appelé le carré moyen de contingence ou contingence quadratique
moyenne, on la note (².
(² = (0.9048)²(0.105 + (-0.2857)²(0.14 + (-1)²(0.07 + (0.4286)²(0.035 + (-
0.4872)²( 0.195 + (0.1538)²(0.26 + (0.5385)²(0.13 + (-0.2308)²(0.065 =
0.2674
Plus (² est élevé, plus la dispersion est élevée, plus on s'éloigne de
l'indépendance. Pearson a normalisé (² e