Préliminaires

De nombreux exercices peuvent être mis en place dans les différents domaines
d'activités. À titre d'exemples : - Travail systématique sur le tracé de chaque ...

Part of the document


Préliminaires Exercice 1-1
Différence population -échantillon :
. la population désigne l'ensemble des éléments de tout type de champ
d'analyse ayant des propriétés communes et pris en considération par
un statisticien pour le quantifier.
. Un échantillon est un sous-ensemble de la population étudiée sur
lequel s'effectue une étude statistique. Définition de la variable : Chaque unité statistique ou individu s'il fait partie de la même population
qu'un autre varie cependant selon certains critères appelés caractères ou
variables qui comme leur nom l'indique varient d'un élément à l'autre et
permettent de caractériser la population sur base des individus. Etapes d'une méthode statistique : . Poser le problème : toute recherche émane d'un problème, souvent une
non adéquation des résultats observés par rapport aux résultats
attendus sur base d'un modèle. Le chercheur s'efforcera de formuler
explicitement le problème.
. Simplification - idéalisation : ne pas vouloir mettre en jeu trop de
variables mais plutôt simplifier le problème pour ne retenir que
quelques variables essentielles, les autres restent fixées.
. Mesure : collecte des données
. Manipulation - transformation : ces opérations sont effectuées pour
simplifier le modèle ou répondre à certaines exigences statistiques.
. Vérification : par un certain nombre de tests statistiques. Différence répétabilité - reproductibilité La répétabilité est une mesure de la fidélité lorsque les mesures
sont faites par un même opérateur sur un même instrument, selon une
méthode unique et dans un délai court. L'objectif est d'obtenir des
mesures dans des conditions similaires. La reproductibilité : mesure de la fidélité sans restriction
d 'opérateur, d 'instrument, de méthode ou de temps. La précision
correspond à la reproductibilité. L'objectif est d'obtenir des mesures
dans des conditions où une ou plusieurs sources de variabilité peuvent
interférer. Différence fidélité - justesse La fidélité est étroitesse de l'accord entre les mesures effectuées
sur des prises multiples d 'un échantillon homogène. Cette fidélité
peut avoir 2 aspects : La justesse est l'étroitesse de l 'accord entre une mesure ou la
moyenne des mesures et la valeur conventionnellement vraie de
l 'échantillon. Elle mesure la proximité des résultats en référence à
une valeur reconnue par d'autres laboratoires. Différence spécificité - sensibilité La sensibilité est le rapport de la variation de la réponse
instrumentale par rapport à la variation de la concentration. La spécificité est la mesure de l'analyte avec la garantie que le
signal ne provient que de l'analyte
Différentes sources d'erreurs.
Dans un problème mathématique: o l'erreur absolue : différence prise en valeur absolue entre la
valeur observée et la valeur de référence.
o l'erreur relative : rapport de l'erreur absolue à la valeur de
référence.
o l'erreur d'arrondi : erreur résultant du remplacement d'une valeur
numérique par une autre toute proche mais tronquée. Le calcul à n
décimale entraîne une erreur d'arrondi comprise entre -0.5 10-n et
0.5 10-n. L'erreur d'arrondi peut avoir une importance lors de
longues procédures de calcul par ordinateur. Aussi conseille-t-on
d'effectuer les calculs avec tous les chiffres et d'arrondir pour
la présentation des résultats.
Dans un problème statistique : o l'erreur aléatoire : erreur résultant de la combinaison de
multiples erreurs partielles imputables à l'instrument, à
l'expérimentateur, aux fluctuations des conditions expérimentales.
Les propriétés statistiques et leur estimation s'étudient par le
calcul de probabilité. Elle se détermine par la répétition de
l'expérience. Cette erreur affecte la précision d'un résultat. De
larges erreurs aléatoires conduisent à une faible précision.
Exemple : en repesant plusieurs fois le même échantillon, de
légères fluctuations de poids seront observées.
o l'erreur systématique : erreur qui provient de causes permanentes.
Les résultats dévient systématiquement de la valeur exacte suite à
un appareillage non calibré ou à une erreur systématique de
l'expérimentateur. Ce type d'erreur affecte l'exactitude de la
mesure et donne naissance au biais statistique. Exemple : un
mauvais calibrage d'un colorimètre par oubli du réglage du 0%
d'absorbance et 100% de transmittance.
o l'erreur accidentelle : elle n'est pas liée à l'outil de mesure
employé mais à l'expérimentateur lui-même. Exemple : erreur de
lecture d'une pesée ou de dilution.
o l'erreur expérimentale : erreur due à des variables non contrôlées.
Exemple : fluctuation de la température pendant une réaction
chimique.
o L'erreur résiduelle : elle correspond à la différence entre la
valeur estimée et la valeur observée. Elle est souvent désignée
sous le terme de résidu.
Toute erreur qui survient dans le cadre statistique est une
combinaison de ces différentes erreurs.
Dans un test d'hypothèse Dans une étude faisant intervenir des tests d'hypothèses, les erreurs
suivantes sont rencontrées : o L'erreur de première espèce : erreur que l'on commet en rejetant
l'hypothèse nulle lorsqu'elle est vraie.
o L'erreur de seconde espèce : on ne rejette pas l'hypothèse nulle
alors que celle-ci est fausse.
Dans une expérience : Différents facteurs peuvent influencer le résultat des observations : - Facteurs contrôlés : grandeurs auxiliaires telles la température,
pression,... qui caractérisent l'environnement et qui en principe
sont maîtrisé par l'expérimentateur.
- Facteurs parasites : ou erreur dans les observations suite à l'une
des raisons suivantes :
- Erreur de mesure due à l'instrument, à la technique ou à
l'utilisateur.
- Erreur de représentativité : dans certaines techniques, comme la
GLC, la grandeur physique directe est difficile d'accès.
- Erreur due à l'instabilité du phénomène observé au cours du temps.
Il est le fait de notre ignorance, le reflet de notre incapacité à
maîtriser tous les degrés de liberté d'une situation. Etapes d'un protocole de traitement de données 1. La compréhension du domaine d'application :. 2. Création d'un sous-ensemble sur lequel portera l'analyse 3. Nettoyage : éliminer ou caractériser dans l'ensemble les erreurs, les
données manquantes ou les valeurs atypiques (outliers). 4. Transformation des données : 5. Définir l'objectif et la stratégie d 'analyse parmi les suivants : 6. Choix de la méthode de modélisation 7. Validation de la méthode 8. Prévision 9. Diffusion de l'information Différence statistique descriptive - statistique inférentielle . La statistique descriptive se propose de classer les données, de les
organiser et de les présenter clairement par les tableaux, la
présentation graphique et les résumés numériques. . La statistique inférentielle a comme objectif principal de caractériser
une population sur base d'observations sur un échantillon. Exercice 1-2 1. Vous mettez en titre une solution acide avec une base de titre connu
(NAOH 0.1 N). Vous obtenez les résultats donnés par le tableau ci-
dessous. Déterminez : |ml NaOH |pH |
|1 |1 |
|2 |1.1|
|3 |1.2|
|4 |1.3|
|5 |1.5|
| |. |
|6 |2 |
|7 |3 |
|8 |4 |
|9 |5 |
. La variable dépendante et indépendante : dépendante : pH et
indépendante : NaOH.
. La nature des variables : quantitative.
. Les variables sont continues.
. La liaison qui unit les ml au pH est une régression.
2. Vous administrez un traitement 1 à un groupe de souris et un Placebo à
un autre groupe. Vous déterminez une variable Y qui représente le
nombre de tumeurs /souris. Répondez aux questions suivantes :
. La variable Y est continue : non
. La variable Y est qualitative : non
. Le traitement est une variable : oui
. Le traitement est une variable quantitative : non