S5 de Psychologie - TD n° 2 - Normalesup.org

Exercices de révision ... Un sondage est une étude qui porte sur un échantillon
représentatif de la population afin de connaître ... L'échantillon n'est pas
représentatif de la population : sa taille est insuffisante, il comprend ... 7. Donne
un exemple de données qualitatives : La couleur, la grandeur d'un vêtement (
petit, moyen, ...

Part of the document


Licence de Psychologie - Semestre N° 5 - TD n° 2
Intervalles de confiance, lois de distribution classiques et tests
paramétriques avec Statistica
Travail sur des données recensées : statistiques descriptives sur un
tableau d'effectifs
1 Introduire une pondération dans la feuille de données On considère l'exemple suivant :
Dans le cadre d'une analyse médicale, deux méthodes de dosage peuvent être
utilisées. A partir d'un même prélèvement, on répète 25 fois la méthode A
et 30 fois avec la méthode B. Les résultats sont rassemblés dans les
tableaux rassemblés dans le classeur Dosages.stw. Ouvrez le classeur Dosages.stw et observez la façon dont les données ont
été saisies dans les feuilles Méthode A, Méthode B et Ensemble. Contrairement aux exemples traités précédemment, les données sont ici
présentées sous la forme de tableaux recensés : les observations ont fait
l'objet d'un tri à plat. Par exemple, la valeur 42 a été obtenue 7 fois
comme résultat de mesure par la méthode A. Comment effectuer les traitements de Statistiques descriptives sur des
données structurées sous cette forme, par exemple dans la feuille "Méthode
A" ? Il faut indiquer à Statistica que la colonne "Nombre de dosages" est une
colonne d'effectifs ou pondérations des données. Les pondérations peuvent aussi bien être définies comme propriété de la
feuille elle-même que comme propriété de l'une des analyses. Dans le premier cas, on affiche la feuille de données et on utilise le
bouton "pondérations" de la barre d'outils : [pic]. Les pondérations
s'appliquent alors à toutes les analyses utilisant cette feuille. Dans le deuxième cas, on utilise l'un des items du menu Statistiques et on
clique sur le bouton "pondérations" [pic] de la fenêtre de dialogue. Les
pondérations ne concerneront alors que l'analyse en cours. Ici, rendez active la feuille "Méthode A" et indiquez que la variable 2
(Nombre de dosages) est la variable de pondération : [pic] Le reste du traitement peut alors être réalisé de la même façon que pour un
tableau-protocole. On obtient par exemple:
[pic] Remarquez que le nombre d'observations pris en compte n'est pas égal à 9
(nombre de lignes du fichier) mais à 25 (somme des effectifs contenus dans
la deuxième colonne). De même, réalisez à l'aide du menu Graphiques, l'histogramme suivant :
[pic]
2 Calculer des paramètres de statistiques descriptives pour des données
structurées "par groupe"
Nous souhaitons calculer la moyenne, la variance et l'écart type de la
variable "Valeur mesurée" pour chacune des méthodes, et obtenir les
résultats dans une même feuille de résultats. - Rendez active la feuille "Ensemble" et définissez la variable "Nombre
de dosages" comme variable de pondération.
- Utilisez ensuite le menu Statistiques - Statistiques Elémentaires et
la méthode "Décompositions ; tableaux non factoriels".
- Sous l'onglet "Base", indiquez "Valeur mesurée" comme variable
dépendante et "Méthode" comme variable de classement.
- Sous l'onglet "Statistiques descriptives", sélectionnez les
paramètres à calculer : écart type, variance et N.
- Cliquez sur l'un des boutons "Synthèse". Vous devriez obtenir :
|Statistiques Descriptives par Groupes (Ensemble |
|dans Dosages-correction.stw) |
|N=55(pas de VM dans les vars dépendantes) |
| |Méthode |Valeur |Valeur |Valeur |Valeur |
| | |mesurée |mesurée|mesurée |mesurée |
| | |Moyennes |N |Ec-Types |Variance|
| |A |42,08000 |25 |2,271563 |5,160000|
| |B |42,10000 |30 |1,398275 |1,955172|
| |TsGrpes |42,09091 |55 |1,828506 |3,343434| Remarque. Dans le cas de situations plus complexes, on pourra obtenir des
résultats du même type à l'aide de la méthode "Décompositions & ANOVA à un
facteur" du même menu Statistiques - Statistiques Elémentaires. Les
résultats de statistiques descriptives sont disponibles sous l'onglet
"Listes de tables". Mais l'interface de la fenêtre de dialogue est alors
plus compliquée, puisque l'on peut indiquer jusqu'à 6 listes de variables
de classement.
[pic] Choisissez ensuite la variable "Valeur mesurée" comme variable dépendante : [pic] Les résultats obtenus sont identiques aux précédents. Intervalles de confiance
1 Intervalle de confiance pour une moyenne Les méthodes "Statistiques descriptives", "Décompositions ; tableaux non
factoriels" et "Décompositions & ANOVA à un facteur" du menu Statistiques -
Statistiques élémentaires permettent également d'obtenir une estimation de
la moyenne d'une variable numérique par un intervalle de confiance avec un
degré de confiance donné. Ainsi, à partir de l'échantillon de mesures réalisées par la méthode A,
quel intervalle estimant la "vraie valeur" de la substance dosée peut-on
donner avec un degré de confiance de 95% ? Rendez active la feuille "Méthode A" et utilisez le menu Statistiques -
Statistiques Elémentaires puis la méthode "Statistiques descriptives" en
complétant la fenêtre de dialogue comme ci-dessous :
[pic] Vous devriez obtenir les résultats suivants :
[pic] Autrement dit, on estime, avec un degré de confiance de 95%, que la vraie
valeur de la quantité à doser est comprise entre 41,14 et 43,02. - Rendez active la feuille "Ensemble" et utilisez le menu Statistiques
- Statistiques Elémentaires puis la méthode "Décompositions ; tableaux
non factoriels" en indiquant comme précédemment "Valeur mesurée" comme
variable dépendante et "Méthode" comme variable de classement.
- Sous l'onglet "Statistiques descriptives", remplissez la fenêtre de
dialogue comme suit : [pic] Vous devriez obtenir : |Statistiques Descriptives par Groupes (Ensemble dans |
|Dosages-correction.stw) |
|N=55(pas de VM dans les vars dépendantes) |
|Méthode |Valeur |Valeur |Valeur |Valeur |Valeur |
| |mesurée |mesurée |mesurée |mesurée |mesurée |
| |Moyennes |N |Ec-Types |Confiance|Confianc|
| | | | | |e |
| | | | |-95.000% |+95.000%|
|A |42,08000 |25 |2,271563 |41,14234 |43,01766|
|B |42,10000 |30 |1,398275 |41,57788 |42,62212|
|TsGrpes |42,09091 |55 |1,828506 |41,59659 |42,58522| On voit que les intervalles de confiance obtenus pour chacune des méthodes,
[41,14; 43,02] et [41,58; 42,62] se recouvrent largement. Un test de
comparaison de ces moyennes devrait donc conduire à accepter leur égalité
dans les populations parentes.
Exercice : De même, comparez les intervalles de confiance obtenus par les
deux méthodes en utilisant la feuille "Ensemble" et le menu Statistiques -
Statistiques Elémentaires - Décompositions & ANOVA à un facteur.
2 Intervalle de confiance pour une proportion Lors d'un sondage électoral, on interroge au hasard 1000 personnes. 535
personnes déclarent vouloir voter pour le candidat A pendant que 465
déclarent vouloir voter pour un autre candidat. Quel intervalle de
confiance, avec un degré de confiance de 95%, peut-on donner concernant le
score du candidat A ? Pour répondre à cette question, on peut :
- Créer la feuille de données suivante :
[pic] - Au besoin définir des étiquettes de texte pour la variable "Candidat", de
façon que la feuille affiche "Candidat A" et "Autres Candidats". Pour cela,
faire un double-clic sur la tête de la colonne "Candidat", puis utiliser le
bouton "Valeurs-Texte" :
[pic] [pic] - Définir la variable "Suffrages" comme variable de pondération. - Déterminer l'intervalle de confiance comme précédemment, à l'aide de la
méthode "Statistiques descriptives".
:
[pic] Au vu de l'intervalle trouvé, il semblerait que l'on puisse affirmer, avec
un degré de confiance de 95%, que le candidat A sera élu... Lois statistiques classiques Le menu Statistiques - Calculateur de Probabilités - Distributions permet
d'une part de trouver une valeur critique ou un niveau de significativité
pour les lois statistiques continues usuelles, soit de réaliser des
représentations graphiques de la densité ou de la fonction de répartition
de ces lois. 1 La loi normale centrée réduite Quelle est la valeur de Zcritique pour un test unilatéral à 5% ?
Compléter le dialogue comme suit :
[pic]
La réponse doit être lue dans la zone d'édition "X: ________". C'est ici :
Zc=1,644854. 2 Représenter graphiquement la densité d'une loi normale quelconque On veut représenter la densité de la loi normale de paramètres m = 100 et
s=15 pour X compris entre 70 et 130
Complétez la fenêtre de dialogue comme suit, en veillant à ce que la boite
"Echelle Fixe" ne soit pas cochée : [pic]
Remarquez que Statistica exige que l'un des deux champs "X:" ou "p:" soit
complété, et repère la valeur correspondante sur le graphique. On obtient
ainsi un graphique ayant l'allure suivante :
[pic] 3 Loi de Student Calculez la valeur critique de la loi de Student pour un test bilatéral
avec ddl=24 et ?=0,01 :
[pic] [pic]
Remarquez que les paramètres peuvent être entrés de deux façons différ