Chapitre 2 :

Pour cela, une programmation a été effectuée sous S.A.S. Puis, nous avons
utilisé une procédure de régression linéaire avec autocorrélation des erreurs (
Autoreg) pour calculer les paramètres de la ..... Cela se fait le plus souvent par
des techniques faisant appel à la régression multiple et aux modèles
économétriques.

Part of the document


SOMMAIRE
INTRODUCTION 2 CHAPITRE 1 : Présentation du stage 3
1.1 Présentation de l'ENGEES 3
1.2 Objectifs du stage 3
1.2.1 Prévision horaire de consommation d'eau potable. 3
1.2.2 Le modèle - Le logiciel SAS. 4
1.3 Travaux précédents 5 CHAPITRE 2 : Quelques notions mathématiques 7
2.1 Généralités sur les séries temporelles : 7
2.1.1 Définition : 7
2.1.2 Comment débuter l'analyse d'une série ? 7
2.1.3 Les différentes composantes d'une série : 8
2.1.4 Objectifs de l'étude d'une série : 8
2.1.5 Modélisation d'une série temporelle : (d'après Gouriéroux,
Monfort 1983) 9
2.2 La régression linéaire simple. 10
2.2.1 Le modèle de régression simple. 10
2.2.2 Analyse de régression. 17
2.2.3 Le modèle de régression simple en termes de matrice. 21
2.3 La régression multilinéaire. 27
2.3.1 Le modèle de régression linéaire général 27
2.3.2 Le modèle sous forme matricielle 27
2.3.3 Estimation des coefficients de régression 28
2.3.4 Valeurs ajustées et résidus 29
2.3.5 Analyse de variance 29
2.3.6 Le coefficient R2 30
2.3.7 Les paramètres de régression 31
2.3.8 Estimation de la réponse moyenne et prévision 32
2.4 Autocorrélation des erreurs 33
2.4.1 Autocorrélation d'ordre 1 33
2.4.2 Test de Durbin-Watson 36 CHAPITRE 3 : Prévision de consommation 37
3.1 Statistique descriptive 37
3.1.1 La consommation d'eau 37
3.1.2 Courbe de répartition par fréquence 38
3.1.3 Profils journaliers 40
3.2 Les modèles utilisés et les résultats 48
3.2.1 Modèle avec une seule valeur retardée de la demande. 48
3.2.2 Modèle avec deux valeurs retardées de la demande. 55
3.3 Tentative de modélisation pour une prévision sur 24h. 59 CONCLUSION. 66 BIBILIOGRAPHIE 67 ANNEXES 68 REMERCIEMENTS 79 Introduction
Le stage à l'Ecole Nationale du Génie de l'Eau et de l'Environnement
de Strasbourg, avait pour objet la prévision de consommation d'eau potable
pour une zone nommée Vallée qui se trouve dans la région de Sarralbe.
Ce travail s'inscrit dans une étude plus large qu'effectue Denis GILBERT,
enseignant-chercheur à l'ENGEES : La gestion en temps réel des réseaux
d'eau potable.
La période d'enregistrement de la consommation d'eau débute en 1993 et
s'achève en 1998. Les fichiers de données comportent les consommations
d'eau en m3, au pas de temps de l'heure pour cette période. Dans un premier temps, il s'agissait de réactualiser le fichier
existant avec les données de consommation de 97 et 98, puis de les
déparasiter (détection et suppression des valeurs aberrantes).
Il a fallu, dans un deuxième temps, codifier les variables mises en jeu.
Pour cela, une programmation a été effectuée sous S.A.S. Puis, nous avons
utilisé une procédure de régression linéaire avec autocorrélation des
erreurs (Autoreg) pour calculer les paramètres de la régression et ceux de
l'autoregression (des erreurs). Pour vérifier si la variable demande
(consommation) était bien expliquée par notre modèle, nous avons procédé à
un test de bruit blanc.(un programme complet figure en annexe). Nous avons procédé à plusieurs modélisations après observation des
résultats et tenté de trouver une méthode de prévision pour 24 heures.
CHAPITRE 1 : Présentation du stage 1. Présentation de l'ENGEES L'Ecole Nationale du Génie de l'Eau et de l'Environnement de Strasbourg
(ENGEES) est un établissement d'enseignement supérieur dépendant du
Ministère de l'Agriculture et de la Pêche. Elle forme des ingénieurs dont
l'activité porte sur l'hydrologie urbaine (adduction d'eau potable,
assainissement, épuration), l'aménagement du territoire, l'ingénierie du
milieu naturel. Les employeurs sont principalement l'Etat, les
collectivités, les bureaux d'ingénierie et les grands groupes distributeurs
d'eau.
L'établissement comprend aussi une activité de recherche répartie sur trois
unités :
o Gestion des Services Publics (GSP) : L'unité Gestion des Services Publics
(commun entre l'ENGEES et le Cemagref) développe une recherche appliquée
à la gestion des services publics locaux à caractère industriel et
commercial : l'alimentation en eau potable, l'assainissement, la collecte
et le traitement des déchets ménagers. o L'unité Territoires et Environnement (LTE) : L'unité Territoires et
Environnement vient de fusionner avec le Centre d'Etudes et de Recherches
Eco-géographiques (CEREG) pour former une UMR sous triple tutelle de
L'Université Louis Pasteur (ULP), du CNRS et de l'Ecole Nationale du
Génie de l'Eau et de l'Environnement de Strasbourg. o Systèmes Hydrauliques Urbains (SHU) : Cette unité propre à
l'établissement travaille sur les réseaux d'eau urbain et sur le
traitement d'eau usée. Pour l'assainissement, les études visent à
caractériser les rejets en temps de pluie vers le milieu naturel et à
mettre au point des outils d'aide à la conception ou à la gestion
minimisant ces rejets et leurs effets. Pour l'eau potable, le
vieillissement des conduites est modélisé dans le but de prédire leur
durée de vie. Enfin, la gestion en temps réel des ouvrages d'eau ou
d'assainissement fait l'objet de travaux développés depuis une dizaine
d'années. L'une des composantes de cette gestion consiste en la prévision
des consommations d'eau potable que nous allons aborder ci-dessous.
2. Objectifs du stage 1. Prévision horaire de consommation d'eau potable. L'objectif du stage est la prévision de consommation d'eau potable pour
une zone nommée Vallée se situant sur le Syndicat Intercommunal des eaux de
la région de Sarralbe. Nous disposons pour cela des données de consommation
d'eau relevées au pas de temps de l'heure du mois d'août 1993 au mois de
novembre 1998. Cependant, il manque des données, parfois sur plusieurs
jours, du fait de défaillances du système de mesure ou de rapatriement de
la mesure. A cela, s'ajoute une autre difficulté, en effet, certaines
valeurs s'écartent significativement des valeurs habituellement
observables. Ces valeurs aberrantes sont le fait de dysfonctionnements
d'ordre hydraulique (casse ou fuite) ou des erreurs de mesure (capteurs,
télétransmission ou archivage des données). Nous avons donc procédé à un
traitement des données qui a consisté à éliminer les valeurs suspectes.
Cela a eu pour conséquence d'augmenter le nombre de valeurs manquantes
(environ 30% sur la période considérée).
2. Le modèle - Le logiciel SAS. La suite des données forme une série temporelle aussi appelée série
chronologique. La modélisation et le choix des variables explicatives ont
déjà été faits par Denis GILBERT, Vincent FERSTLER et Florent GUHL lors
d'études antérieures (cf. paragraphe suivant). Le modèle choisi est un
modèle linéaire . Pour effectuer des prévisions nous utilisons la méthode
de régression linéaire avec autocorrélation des erreurs.
Le modèle construit peut s'écrire sous la forme : Équation 1-1 [pic]
[pic]
où,
. [pic]est la demande au temps t
. D(t-1) est la demande au temps t moins une heure
. D(t-24) est la demande au temps t moins 24 heures (la même heure le jour
précédent)
. A est l'année (ex : 1993)
. Les [pic]déterminent le mois de l'année. Ce sont des variables binaires
prenant la valeur 0 ou 1 pour définir le mois correspondant au temps t
avec la convention que si toutes ces variables sont nulles le mois est le
12ème (décembre).
. J est le numéro du jour dans le mois (ex : 26 mars1993)
. JS code le numéro du jour dans la semaine, le 7ème s'obtient lorsque les
six [pic] sont nuls.
. [pic]code l'heure de la journée (de 1 à 23, la 24ème s'obtenant lorsque
tous les [pic]sont nuls)
. VAC est une variable binaire qui prend la valeur 1 en période de vacances
scolaires, 0 sinon.
. De même pour FER, si le jour considéré est férié.
. u(t) est l'erreur (sans autocorrélation). Etant donné le nombre important de données (environ 46000), il est
nécessaire d'avoir recours à un logiciel. Nous utilisons S.A.S. et en
particulier la procédure Autoreg. Cette procédure utilise la méthode de
régression linéaire pour les séries temporelles lorsque les erreurs sont
autocorrélées.
La procédure Autoreg résout le problème suivant :
Équation 1-2 [pic] [pic] est le vecteur ligne des variables
[pic] le vecteur colonne des
coefficients La notation [pic] indique que chaque [pic] possède une distribution normale
et indépendante de moyenne 0 et de variance [pic].
La procédure Autoreg estime simultanément les coefficients de la régression
et les paramètres [pic]du modèle autorégressif de l'erreur. Plusieurs méthodes d'estimation nous sont proposées entre autre la méthode
de Yule-Walker et la méthode du maximum de vraisemblance. Le manuel SAS/ETS
préconise l'utilisation de la méthode du maximum de vraisemblance lorsque
le nombre de valeurs manquantes est important et lorsque figurent dans les
variables explicatives des valeurs retardées de la variable expliquée
(lagged dependent variables). Remarquons, que dans ce dernier cas
l'estimateur du maximum de vraisemblance n'est pas l'exact maximum de
vraisemblance, il est conditionnel.
Pour le calcul des estimateurs du maximum de vraisemblance SAS utilise un
algorithme de Gauss-Marquardt pour minimiser les sommes des carrés et
maximiser le logarithme de la vraisemblance. L'optimisation qui en résulte
est