Fichier PDF

Partage, hébergement, conversion et archivage facile de documents au format PDF

Partager un fichier Mes fichiers Boite à outils PDF Recherche Aide Contact



réseaux connexionnistes .pdf



Nom original: réseaux connexionnistes.pdf

Ce document au format PDF 1.2 a été généré par / ABBYY FineReader 8.0 Professional Edition, et a été envoyé sur fichier-pdf.fr le 01/02/2017 à 22:25, depuis l'adresse IP 41.104.x.x. La présente page de téléchargement du fichier a été vue 223 fois.
Taille du document: 996 Ko (16 pages).
Confidentialité: fichier public




Télécharger le fichier (PDF)









Aperçu du document


Hydrological Sciences -Journal- des Sciences Hydrologiques,4l(2) April 1996

Modélisation de la relation pluie-débit par
les réseaux connexionnistes et le filtre de
Kalman
I. DIMOPOULOS, S. LEK & J. LAUGA
UMR 9964, Equipe de Biologie Quantitative, Université Paul Sabotier,
118 Route de Narbonne, F-31062 Toulouse Cedex, France
Résumé Le débit d'une rivière est lié, par des relations complexes, à
une multitude de variables dont les valeurs sont difficilement disponibles.
Le but de cet article était de construire un modèle de prévision du débit
basé sur la seule connaissance de valeurs débimétriques et pluviométriques. Les modèles proposés ont été implémentés pour l'utilisation
combinée de deux méthodes : une méthode de réseaux connexionnistes
permettant de tenir compte de la non-linéarité de la relation pluie-débit
et une technique adaptative, le filtre de Kalman, permettant la correction
des prévisions en temps réel. La relation pluie-débit a été ainsi modélisée
pour deux rivières du nord de la France. Les modèles établis à pas de
temps journalier ou hebdomadaire ont permis des prévisions satisfaisantes
et ceci pour différents horizons de prévision.
Rainfall-runoff modelling by neural networks and Kalman
filter
Abstract River flow results from the interplay of numerous variables for
which quantitative information is not easily available. The aim of this
paper was to develop a river-flow forecasting model based only on rainfall and runoff information. The proposed model has been implemented
with the combined utilization of two methods: a neural network method,
which takes into account the non-linearity of the rainfall-runoff
relationship and an adaptative technique, the Kalman filter, allowing real
time correction of estimates. The rainfall-runoff relationship has been
modelled on two rivers in northern France. The weekly and daily time
step models gave satisfying forecasts, even for different lead times.

INTRODUCTION
La prévision du débit d'un cours d'eau est une motivation primordiale pour
tenter de décrire le comportement d'un bassin versant. Cependant une telle
description, pour peu que l'on veuille obtenir une certaine finesse ayant valeur
explicative, c'est-à-dire mettant en oeuvre les propriétés de ses éléments
constitutifs, aboutit très vite à une situation inextricable, même si l'on sait
écrire les relations auxquelles obéissent les éléments. Le nombre élevé de
paramètres (pour la plupart d'un calcul difficile, imprécis ou incertain et
coûteux) et d'équations, entraîne la plupart du temps l'impossibilité pratique de
leur utilisation.

Open for discussion until I October 1996

179

180

I. Dimopuolos et al.

Souvent on ne dispose que de séries de valeurs des variables que l'on
cherche à expliquer et à prédire. Par exemple, les gestionnaires d'un bassin
versant disposent de valeurs de débit pour des périodes plus ou moins longues,
et de données de précipitations. L'analyse statistique des séries chronologiques
multivariées est un outil statistique important pour l'étude de telles données.
Elle permet d'étudier leur comportement et de prévoir les valeurs futures les
plus probables en fonction des valeurs passées. En contrepartie, ceci est fait
avec peu de rationalisation des relations liant les données. Les relations entre
variables, modèle, et prédictions sont établies post-facto, une fois que le
modèle simulant les données est mis en place. Plusieurs techniques disponibles
pour l'analyse des séries chronologiques supposent la linéarité des relations
entre les variables (Box & Jenkins, 1970). Dans la réalité, les séquences de
données hydrologiques présentent des irrégularités importantes. Les variables
météorologiques et les écoulements sont liés par des relations non-linéaires. La
décrue est plus rapide pour une crue à niveau d'eau plus élevé; ainsi, les
variations du débit ne peuvent pas être décrites facilement par des relations
linéaires. Tong (1990) décrit certains inconvénients des modèles linéaires pour
l'analyse des séries chronologiques et il suggère l'utilisation des modèles
non-linéaires tels que le modèle à seuil et le modèle bilinéaire. Granger &
Newbold (1986), Ozaki (1985) recommandent l'utilisation de transformations
non-linéaires des données initiales, avant leur modélisation linéaire.
Malgré leurs inconvénients les modèles linéaires sont largement utilisés à
cause de leur simplicité et de la bonne connaissance théorique dont on dispose.
Les modèles linéaires adaptatifs sont une classe de modèles ayant des caractéristiques intéressantes. Ils permettent l'estimation recursive de leurs paramètres
et ils offrent la possibilité de tenir compte des non-stationnarités manifestées dans
les systèmes hydrologiques (Szôllôsi-Nagy, 1975). La construction des modèles
adaptatifs peut être basée sur une description du processus étudié dans l'espace
d'état (Bennett, 1979). Kalman (1960), a développé une technique d'estimation
recursive, habituellement appelée filtre de Kalman (FK), pour la résolution des
problèmes du contrôle et de l'analyse de systèmes. Depuis, le FK et ses variantes
ont trouvé de nombreuses applications en hydrologie, telles que la prévision des
écoulements d'eau et des concentrations en éléments nutritifs (Szôllôsi-Nagy,
1975; Lauga, 1986; Singh & Majumdar, 1993), la prévision des crues (Sambou
& Thirriot 1993), la gestion des ressources en eau (Tamura étal., 1988; Moore
& Jones ,1978; Moore, 1988), la prévision de la qualité des eaux(Sirviô, 1989).
En dépit de ses caractéristiques intéressantes le FK reste une méthode
linéaire présentant les inconvénients inhérents à ce type de méthode. Une variante
de FK connue sous le nom filtre de Kalman étendu (EKF) permet de modéliser
des relations non-linéaires. L'EKF est basé sur une linéarisation locale par un
développement en série de Taylor limité au premier ordre. Ce filtre a une tendance à diverger si le passage d'une estimation à l'estimation suivante s'écarte
des limites de la zone de linéarité, surtout lorsque les non linéarités sont fortes
et la zone de linéarité étroite (Najim, 1988). Le recours à des méthodes nonlinéaires s'avère donc nécessaire. Parmi les plus prometteuses figurent les

Modélisation de la relation pluie-débit

181

approches basées sur les réseaux connexionnistes (RC).
Depuis quelques années, les réseaux connexionnistes ont trouvé une vaste
utilisation dans la modélisation des séries chronologiques (Chakraborty et al.,
1992; Weigend & Gershenfeld, 1993; Gencay, 1993; Hoptroff, 1993). Ceci est
dû, en grande partie, à leur capacité d'interpoler des données liées par des
relations non-linéaires. Les réseaux les plus répandus sont les réseaux multicouches avec ajustement des paramètres par rétropropagation (Rumelhart et al.,
1986). Contrairement au filtre de Kalman l'adaptation des paramètres ne peut
pas être réalisée en temps réel, ou bien elle est beaucoup plus compliquée (Li
& Haykin, 1993).
Une utilisation conjointe des RC et du FK est présentée ici, visant à
combiner les avantages de l'une et de l'autre. Elle tire profit de la capacité
d'approximation de RC et de l'adaptativité en temps réel du FK. Cette technique est alors utilisée pour construire des modèles de prévision du débit de
deux rivières du nord de la France.
Dans la deuxième partie de l'article sont présentés une description des
méthodes, des données, des types de prévision testés ainsi que des critères de
performance utilisés. Les résultats et leur discussion sont abordés dans la
troisième partie.

METHODOLOGIE
Formulation du problème
Etant donné que les processus étudiés se présentent sous la forme de séries
chronologiques, un modèle de l'hydrogramme comme fonction d'un certain
nombre de paramètres hydrologiques peut être représenté par l'équation:
y(t) = f(w,x(t)) + e(t)

(!)

où y(f) est la variable à prédire au moment t, ici le débit; / est une fonction
linéaire ou non-linéaire; et w est le vecteur de paramètres du modèle. On
considère que les paramètres sont invariants ou présentent des variations
relativement faibles au cours du temps.
x(t) = (y(t - ih),xx(t - jh),x2(t - kh), ...) est le vecteur d'entrées ou
de variables explicatives; t = 1, ..., T; T est le nombre d'observations disponibles; h est l'intervalle d'échantillonnage, égal à un jour, une semaine etc.;
i,j, k sont les indices de retard, i'e{l,...,/}, je{\,...,/},
ke{l,..., K); et 7, / ,
K sont les retards maximum pour les différentes entrées.
e(t) est un terme aléatoire qui peut être considéré comme l'erreur de prévision (résidu).
L'identification du modèle consiste, après avoir défini les différentes
variables d'entrée et la fonction/, à chercher un vecteur w tel qu'une fonction
critère, mesurant l'accord entre la sortie observée et la sortie calculée par le
modèle, soit optimale.

182

/. Dimopuolos et al.

Méthodes de modélisation
Les réseaux connexionnistes multicouches Les réseaux connexionnistes
sont constitués d'éléments de calcul, appelés neurones formels ou artificiels,
répartis en couches. A chaque élément sont associés un état d'activation et une
fonction d'activation (ou fonction de transfert) qui déterminent la valeur de son
activation (ou sa sortie). Contrairement aux couches intermédiaires, appelées
couches cachées, les couches d'entrée et de sortie codent des informations
spécifiques au problème traité. La fonction d'un tel réseau est de modéliser la
transformation entre un espace d'entrée, représenté par les variables explicatives (x{t)), et un espace de sortie, représenté par la(es) variable(s) à expliquer
(y{t)). Le fonctionnement d'un réseau de neurones formels est défini par sa
structure (nombre de couches et de neurones par couches) et par la valeur des
connexions (w) qui relient les neurones entre eux, appelée poids synaptiques.
Ainsi, on peut dire que la fonction / implémentée par le réseau est définie
implicitement par la structure du réseau et la ou les fonctions d'activation.
Divers mécanismes, appelés méthodes d'apprentissage, permettent d'ajuster les
poids synaptiques. Un des plus utilisés est la méthode de rétropropagation
(Rumelhart et al., 1986). Le principe d'apprentissage de cette méthode est
d'appliquer des corrections aux poids synaptiques selon un algorithme de
gradient stochastique visant à minimiser l'erreur quadratique moyenne entre la
sortie du réseau, ye(t), et la sortie désirée, y0(t).
D'après le théorème de Kolmogorov (Cybenco, 1989), sous certaines
conditions peu restrictives sur les fonctions d'activation, un réseau ayant une
couche cachée avec un nombre suffisant de neurones, peut approcher n'importe
quelle fonction continue. En pratique cette grande capacité d'interpolation peut
poser des problèmes, le réseau ayant tendance à modifier ses poids synaptiques
pour modéliser chaque variation, même due à des erreurs dans les données, et
indépendante de la dynamique du phénomène étudié. Pour contrôler ce surapprentissage (overfitting) la série de données est découpée en deux ensembles;
l'ensemble de calage (l'ensemble d'apprentissage en terminologie connexionniste), servant à calculer les paramètres w, et l'ensemble de validation. Ce
dernier n'ayant pour rôle que de contrôler l'apprentissage sur des données
n'appartenant pas à l'ensemble d'apprentissage, il n'intervient en fait pas
directement dans l'estimation des paramètres. Le théorème précédent n'est
toutefois qu'un théorème d'existence et il ne dit rien sur la taille (nombre de
neurones de la couche cachée) adéquate du réseau dans une application spécifique. La taille du réseau est étroitement dépendante de données concernant
l'ensemble d'apprentissage. Si le réseau est relativement grand par rapport à
la complexité du système étudié, il devient sensible au sur-apprentissage, si le
nombre de neurones est trop petit, le réseau se montre incapable d'approcher
la relation entre les variables étudiées. Dans la pratique, le nombre des
neurones est défini empiriquement; après l'essai de réseaux de tailles différentes, le réseau de taille minimale, satisfaisant un critère de performance pour
l'ensemble d'apprentissage et l'ensemble de validation, est retenu. Des

Modélisation de la relation pluie-débit

183

méthodes de construction de réseaux d'une taille minimale existent (Weigend
et al., 1992; Hirose et al., 1991), mais aucune d'entre elles ne peut garantir,
de manière théorique, qu'un réseau est optimal,
Le filtre de Kalman Ici sera présentée et utilisée une version simplifiée
du filtre de Kalman, équivalente à la méthode des moindres carrés récursifs.
Dans ce cas, la fonction / est une fonction linéaire et les paramètres sont
estimés récursivement. w s'adapte dès qu'une nouvelle information devient
disponible, ce qui rend la méthode adaptative.
L'adaptation des paramètres est effectuée par l'utilisation des formules
suivantes (Bennet, 1979):
wt = w M +Kte(t)

(2)

Kt = Pt_xx'(t)[b+x\t)Pt_xx(f)Yl

(3)

Pt = VblP^-KtX'WP^]

(4)

e(t) =y0(t)-ye(t)

(5)

Le vecteur Kt, appelé gain, est une mesure du gain apporté à l'estimation
des paramètres par l'utilisation de la nouvelle observation xt. Le paramètre b
est un facteur d'oubli définissant la largeur d'une fenêtre glissante sur la série
de données. Plus b est proche de 0 plus le modèle est capable de prévoir des
variations brusques, devenant ainsi sensible aux erreurs qui contaminent les
données. Si b est proche de 1 la capacité d'adaptation du modèle est moindre
mais il se montre également moins sensible aux données contaminées par des
erreurs (appareils défectueux, mesures provenant de sources différentes etc.)
Utilisation conjointe des deux méthodes Si les différences entre les
valeurs observées et les valeurs calculées par le RC ne présentent pas les
caractéristiques d'un bruit blanc et montrent des autocorrélations significatives,
le filtre de Kalman peut être utilisé pour modéliser cette série d'erreurs. On
juxtapose au modèle RC un second modèle des erreurs, de type autorégressif
(AR) implémenté par le FK, donnant des corrections aux prédictions de RC.
Cette procédure permet une correction des prévisions en temps réel. A chaque
valeur ye(t), prédite par le RC on ajoute l'estimation d'erreur ee(t), prédite par
leFK.

Données utilisées
A partir des méthodes précédentes, des modèles ont été construits afin de
prévoir les écoulements sur le bassin versant du Boulonnais, situé dans le nord
de la France. Les données utilisées sont les mesures débimétriques de deux

184

/. Dimopuolos et al.

stations, Wimille et Wirwignes, situées respectivement sur les rivières
Wimereux et Liane, et les données pluviométriques de la station de Boulogne
située à l'aval de la Liane.
Pour les deux stations débimétriques, les données sont des moyennes
hebdomadaires sur une période de dix ans (1983-1992, soient 520 valeurs),
ainsi que des moyennes journalières pour la station de Wimille pour la période
du 15 Février 1991 au 31 Décembre 1992 (686 valeurs). Quand aux données
pluviométriques, il s'agit sont des moyennes journalières et hebdomadaires pour
la période 1983-1992 (3653 et 520 valeurs respectivement).

Types de prévision et structure des réseaux
Deux types de prévision ont été testés:
(a)
Prévision du débit à l'instant t, connaissant la pluie et le débit aux
instants précédant t. Le pas de temps h est égal à la journée. Ce type de
prévision a été réalisé seulement pour la station de Wimille où les
données journalières sont disponibles.
(b) Prévision du débit à l'instant t, connaissant la pluie à t ainsi que le débit
et la pluie aux instants précédant t ((t - h) h 1); h est égal à la semaine.
Pour cette prévision deux modèles ont été construits, un pour chaque
station.
Des prévisions à plusieurs horizons ont été effectuées. Pour les
prévisions postérieures à t (t + 1, t + 2/z, ..., t + Ph, où P est l'horizon de
prévision) le débit est calculé itérativement en utilisant le débit prédit aux
moments précédents:
ye(t) =fly0(t-lh),y0(t-2h),

...),ye(t

= f(ye(i),y0(t-lh),...),ye{t
= f(ye(t + lh),ye(t),...),

+

lh)

+ 2h))
...

Pour le modèle à pas de temps journalier, les données de l'année 1991
(320 valeurs) sont utilisées pour le calage et les données de 1992 (365 valeurs)
pour la validation. Pour les modèles à pas de temps hebdomadaire, sur
l'ensemble de 521 valeurs disponibles, les 417 premières sont utilisées pour le
calage et les 104 suivantes pour la validation.
Le choix des entrées pour chaque modèle est orienté par l'analyse des
autocorrélations, des autocorrélations partielles de valeurs du débit, et des
corrélations croisées entre débit et pluie. Pour le modèle à pas de temps journalier, les entrées sont les valeurs du débit pendant les cinq jours précédant le
jour t, et les valeurs de la pluie pendant les trois jours précédents. Quelques
essais préliminaires ont permis de définir la structure du réseau. Une couche

Modélisation de la relation pluie-débit

185

cachée de 10 neurones a été utilisée. Pour les deux modèles à pas de temps
hebdomadaire le vecteur des entrées est composé des valeurs du débit pendant
les deux semaines précédant le moment t et la valeur de la pluie pendant la
semaine précédente, ainsi que sa valeur pour t. Les deux réseaux ont la même
structure avec une couche cachée à huit neurones. Dans tous les cas les
fonctions d'activation pour la couche cachée et le neurone de sortie sont des
fonctions sigmoïdes (fix) — 1/[1 + exp(—*)]).
Une fois que la structure de chacun des trois réseaux est fixée, quelques
essais supplémentaires permettent de définir un seuil d'arrêt pour l'apprentissage. Ce dernier correspond à un niveau d'erreur quadratique moyenne
atteint pour l'ensemble d'apprentissage. Etant donné que la méthode de rétropropagation est une méthode du type gradient, plusieurs solutions satisfaisant
le critère d'arrêt peuvent exister (minima locaux). La solution retenue est celle
qui donne le meilleur résultat sur l'ensemble de validation.

Critère d'évaluation
Pour évaluer la qualité prévisionnelle du modèle, le coefficient de détermination est utilisé. Multiplié par cent, il exprime le pourcentage de la variance
de la variable à prédire expliqué par le modèle:

i{ycM)-ye{t)f
R = i±
2

(6)

avec
y0 = (l/ï)

ly0(t)

R2 est calculé sur l'ensemble d'apprentissage, ainsi que sur l'ensemble
de validation pour les deux types de prévision et pour les différents horizons.
La valeur de R2 ainsi calculée n'est qu'une estimation du coefficient de
détermination. Pour déterminer la signification de cette estimation il faudrait
connaître non seulement son espérance (ou une caractéristique de précision de
cet estimateur par exemple son écart-type), mais idéalement aussi, il faudrait
connaître la distribution de probabilité de R2. L'objectif est d'obtenir la
distribution de probabilité du coefficient de détermination pour une solution
spécifique (l'ensemble des paramètres du modèle après l'apprentissage) et pour
un ensemble de données (celui utilisé pour la modélisation), sans faire référence
à une loi quelconque pour les couples des valeurs observées et estimées. La
méthode non paramétrique du bootstrap, telle que proposée par Efron (1979;
1987), permet d'obtenir cette distribution.

I. Dimopuolos et al.

186
RESULTATS

Modèle à pas de temps journalier
Le modèle construit par le RC pour la station de Wimille, à pas de temps
journalier, a donné des erreurs présentant une structure. Les autocorrélations
d'ordre 1, 5 et 9, présentées sur la Fig. 1, sont légèrement supérieures à 0.078
(seuil d'autocorrélation significative). Ainsi, une partie de l'information reste
encore dans la série résiduelle. La modélisation de cette série par le FK (avec
b égal à 0.98) a été capable d'extraire cette information et de décorréler les
erreurs. L'amélioration exprimée en termes de R2 n'est pas significative (sans
le FK, R2 est environ 0.785, sans le dépasser et ce, pour l'ensemble des
prévisions).

0.15

-0.15
5
Délai

Fig. 1
Fonction d'autocorrélation (ACF) des résidus du modèle
connexionniste (RC) et du modèle combiné (réseau connexionniste et filtre
de Kalman, RC-FK) pour la station de Wimille. Le pas de temps est
journalier.

0.820

o:

0.780
1

3

5

7

9

24

96

250

320

364

Longueur de la période de prévision (Jours)
Fig. 2 Coefficient de détermination (R2) entre les valeurs observées et
prédites du débit journalier pour la station de Wimille et pour la période de
validation, en fonction de l'horizon de prévision.

Modélisation de la relation pluie-débit

187

La variation du coefficient de détermination, sur l'ensemble de validation, en fonction de l'horizon de prévision est représenté sur la Fig. 2. R2 n'est
que peu modifié pour les différents horizons.
Les séries de valeurs observées et estimées pour les périodes de calage
et de validation sont présentées respectivement sur les Figs 3 et 4. La prévision
est à l'horizon de 365 jours.
La sous-estimation du débit sur quelques pointes de la période de validation semble similaire à celle observée pour la période de calage (crue du
20 Novembre 1991). La période de calage contient peu d'observations avec un
débit élevé (sept jours seulement avec un débit supérieur à 4 m3 s"1), alors que
la période de validation en contient nettement plus (23 jours). La construction
du modèle, basée sur une minimisation de l'erreur moyenne, est surtout influencée par les faibles débits qui représentent la majorité des observations. La
capacité prévisionnelle du modèle pour les fortes augmentations du débit
pourrait être améliorée par une diminution du pas de temps. Le passage aux
moyennes horaires, par exemple, pourrait permettre de prendre en compte
l'intensité de la pluie. L'utilisation de variables synthétiques, à partir des
variables initiales, permettrait également de tenir compte de l'état hydrique du
sol en apportant ainsi une amélioration aux prévisions.
Malgré une certaine différence entre les périodes de calage et de
validation (la valeur moyenne du débit passant de 0.744 m3 s'1 pour les données
de 1991 à 1.302 m3 s"1 en 1992, ceci étant dû aux événements pluvieux plus
importants; la précipitation moyenne journalière pour 1991 étant de 1.656 mm
avec une variance 15.254, et pour 1992 de 2.392 mm avec une variance
22.485), le modèle construit sur les données de 1991 paraît capable de bien
traduire la relation pluie-débit. L'utilisation d'une période de calage plus
longue, contenant plus d'information sur la dynamique du bassin, ne pourrait
qu'améliorer les prévisions.
La moyenne, l'écart-type et les intervalles de confiance de R2 approchés
à partir de 8000 échantillons bootstrap sont présentés sur la première ligne de
la Table 1. Les échantillons bootstrap ont été construits pour les prévisions à
l'horizon 1, et pour le R2 calculé sur l'ensemble de validation. Le "vrai" R2 est
plus petit que 0.748 avec une probabilité inférieure à 5%, et plus petit que
0.715 avec une probabilité inférieure à 1%.
Table 1 Caractéristiques statistiques du coefficient de détermination (R2) entre les valeurs
observées et prédites par les trois modèles (R2 est calculé sur les ensembles de validation
et pour les prévisions à l'horizon un)
Station
Wimille (h = jour)

Moyenne

Ecart-type

Intervalle de confiance
90%

Intervalle de confiance
98%

0.810

0.0358

0.748 < R2 < 0.866

0.715 < R2 < 0.887

2

Wimille
(h = semaine)

0.777

0.0522

0.685 < R < 0.855

0.628 < R2 < 0.879

Wirwignes
(h = semaine)

0.762

0.0702

0.634 < R2 < 0.863

0.535 < R2 < 0.887

188

/. Dimopuolos et al.

16'zt'oe

1-6 ZU'fe-U

l-6'H'8S

i6ira

L6'0rZZ

| 1.6'01'U

1-6WSZ
œ £

166060

i t6"80"t>Z

"g

1.6W80

1.6'ZO'EZ

i-6"Z0"Z0

iS

16'90'IS

16'90'SO

169002

L6'90>0

16W81.

16WZ0

U6"£0'ZU

J

u6"eo'i.o

(tuuj)

(l-SEUJ)

E

Modélisation de la relation pluie-débit

189

ZH'ZVLZ

-g

S6ZL!

S6'H-'6I-

26'tH'ie

S60LSI.

26'60eS

>
e6'60>0

o

£68091

26Z0'9Z

±

'26'ZO'60

26'90'OZ

26901-0 S3

>

£6'S0'£I.

u

ZQ'WVZ

S

26WS0

Z6'£0'Zt

£6'Z0"ZZ

S6S0S

S6'K)'0Z

£6 L0 t0
(LU lu)

(i S tUU)

to o

190

/. Dimopuolos et al.

Modèles à pas de temps hebdomadaire
Les modèles construits par le RC pour les valeurs hebdomadaires des deux
stations donnent des séries résiduelles présentant les caractéristiques d'un bruit
blanc. L'utilisation de FK n'apporte donc aucune amélioration, mais, ce qui
paraît important en pratique, n'apporte aucune détérioration.
La Figure 5 représente les séries des valeurs observées et estimées pour
la période de validation (pour la station (a) de Wimille et (b) de Wirwignes).
Les prévisions sont à l'horizon de 104 semaines. La capacité prévisionnelle des
modèles n'est pas détériorée par l'utilisation de données perturbées par un
bruit, tel que l'écart entre les valeurs observées et estimées, qui est reinjecté
à l'entrée du modèle. Le R2 sur l'ensemble de validation paraît peu affecté par
l'horizon de prévision (Fig. 6).

(a)

+++

Debit observe
Débit estimé

1

H
1
H
IWJLJ

l^UAJ^J
1

11

21

31

»

i ft t-

il 1

A
+

41

51

61

Numéro de la semaine

Fig. 5 Valeurs observées et prédites pour la période de validation: (a) pour
la station de Wimille; et (b) pour la station de Wirwignes (le pas de temps
est hebdomadaire et les prévisions sont à l'horizon de 104 semaines).

Les 8000 échantillons bootstrap pour chacun de deux modèles ont permis
d'approcher les caractéristiques statistiques de R2. Dans les deux cas, le R2 est
calculé sur l'ensemble de validation et pour les prévisions à l'horizon un. La
Table 1 montre les moyennes, les écart-types et les intervalles de confiance
approchés pour les deux modèles. Les valeurs moyennes de R2 sont très
proches de celles calculées sur l'échantillon de base. Pour le modèle de
Wimille, le "vrai" R2 est plus petit que 0.628 avec une probabilité inférieure
à 1%, tandis que celui de Wirwignes pour la même probabilité peut être
inférieure à 0.535.

Modélisation de la relation pluie-débit

191

ce
-o—~~
0.760
0.750

-Wimille
-Wirwignes
1

2

3

4

8

16

32

52

104

Longueur de la période de prévision (Semaines)
Fig. 6 Coefficient de détermination (R1) entre les valeurs observées et
prédites du débit hebdomadaire, pour la période de validation, en fonction
de l'horizon de prévision: (a) pour la station de Wimille; et (b) pour la
station de Wirwignes.

CONCLUSION
La capacité prévisionnelle des réseaux connexionnistes a pu être démontrée lors
d'une compétition organisée par le Santa Fe Institut (Weigend & Gershenfeld,
1993). Plusieurs méthodes non linéaires ont été testées pour la modélisation et
la prédiction de différents types de séries chronologiques. Les modèles connexionnistes ont montré les meilleurs performances. Leur utilisation pour la
modélisation de la relation pluie-débit a été étudiée ici et les résultats paraissent
prometteurs. Malgré le nombre limité de variables utilisées, la capacité prévisionnelle de modèles paraît bonne et leur stabilité, pour les prévisions à des
horizons variés, satisfaisante.
La combinaison de deux méthodes pour la prévision de crues a été proposée par Mailhol (1990), mais son utilisation n'a pas été testée. L'auteur a
proposé l'utilisation de FK pour modéliser les résidus restant après l'application
d'un modèle non linéaire basé sur une fonction de production et une fonction
d'hydrogramme unitaire.
Madsen (1994) a trouvé que la combinaison du FK et du RC pour la
modélisation d'une procédure de mixage thermique améliore les résultats,
surtout lorsque les données sont contaminées par un bruit.
L'enchaînement de deux méthodes utilisé ici semble capable d'améliorer
les prévisions de débit en apportant la possibilité d'une correction continue. Si
la série résiduelle restant après l'application du RC constitue un bruit blanc, les
coefficients du modèle AR, implémenté par le FK, tendent vers zéro, n'apportant ainsi aucune distorsion aux prévisions (cas des modèles à pas de temps
hebdomadaire).
Dans l'hypothèse qu'un RC bien dimensionné soit capable, après
l'apprentissage, de tenir compte de la dynamique non-linéaire du phénomène
étudié, la correction des résidus par le FK permet de prendre en considération

192

/, Dimopuolos et al.

en temps réel des petites non-stationnarités manifestées au cours du temps. Si
les RC montrent une grande capacité d'approximation, leur juste apprentissage
n'est pas pour autant une affaire triviale pouvant être réalisée de manière
ordinaire. Le suivi de l'évolution des paramètres du FK peut permettre de
repérer les changements structuraux dans l'évolution du phénomène étudié
(Szôllôsi-Nagy, 1975; Lauga, 1986) et d'effectuer un nouvel apprentissage du
RC si c'est le cas.

REFERENCES
Bennet, R. J. (1979) Spatial Time Series, Analysis, Forecasting, Control. Pion, London, UK.
Box, G. E. P. & Jenkins, G. M. (1970) Time Series Analysis, Forecasting and Control. Holden-Day, San
Francisco, USA.
Chakraborty.K., Mehrotra, K., Mohan, C. K. & Ranka, S. (1992) Forecasting the behavior of multivariate
time series using neural networks. Neural Networks 5, 961-970.
Cybenko, G. (1989) Approximations by superpositions of a sigmoidal function. Math. Control Signal Syst.
2, 303-314.
Efron, B. (1979) Computers and the theory of statistics: thinking the unthinkable. SIAM Rev. 21, 60-480.
Efron, B. (1987) Better bootstrap confidence intervals. J. Am. Stat. Assoc. 82, 171-185.
Gencay, R. (1993) Nonlinear prediction of observed time series with feedforward Networks. Neural
Network World 6. 721-732.
Granger, C. W. J. & Newbold, P. (1986) Forecasting Economic Time Series. (2nd éd.), Academic Press,
Orlando, Florida, USA.
Hirose, Y., Yamashita, K. & Hijiya, S. (1991) Backpropagation algorithm which varies the number of
hidden units. Neural Networks 4(1), 61-66.
Hoptroff, R. G. (1993) The principles and practice of time series forecasting and business modelling using
neural nets. Neural Comput. & Applic. 1, 59-66.
Kalman, R. E. (1960) A new approach to linear filtering and prediction theory. Trans. ASME J. Basic
Engng D82, 35-45.
Lauga, J. (1986) Adaptative forecasting of drainage-basin dynamics: a potential tool for managers. In: Land
Use Impacts on Aquatic Ecosystems, ed J. Lauga, H. Décamps & M. M. Holland, 191-201. (Proc.
Toulouse Workshop, UNESCO, April 1986).
Li, L. & Haykin S. (1993) A cascaded recurrent neural network for real-time nonlinear adaptive filtering.
In: Proc. IEEE Intern. Conf. on Neural Networks, (San Francisco, California, USA), 857-862.
Madsen, P. (1994) Neural network for combining linear and non-linear modelling of dynamic systems. In:
Proc. IEEE Intern. Conf. on Neural Networks, (Orlando, Florida, USA4) ,541-546.
Mailhol, J.-C. (1990) Adaptativité et validation opérationnelle. Un cas simple sur un modèle élémentaire.
Hydrol. Continent. 5(2), 125-134.
Moore, R. J. & Jones, D. A. (1978) Coupled Bayesian-Kalman filter estimation of parameters and states
of a dynamic water quality model. In: Applications of the Kalman filter to hydrology, hydrolics, and
water resources, ed C. Chiu, 599-635. Proc. AGU Chapman Conference, University of Pittsburgh,
Pennsylvania, USA.
Moore, R. J. (1988) Systems analysis approach to modelling of surface and ground water resources. In:
4ème Symp. Internat. Sur L'analyse des Systèmes Appliquée à la Gestion des Ressources en Eau,
(Rabat, Maroc), 249-254.
Najim, M. (1988) Modélisation et Identification en Traitement du Signal. Masson, Paris, France.
Ozaki, T. (1985) Statistical identification of storage models with application to stochastic hydrology. Wat.
Resour. Bull. 21, 663-675.
Rumelhart, D. E., Hinton, G. E. & Williams, R. J. (1986) Learning internal representations by error
propagation. In: Parallel Distributed Processing: Explorations in the Microstructures of Cognition,
ed D. E. Rumelhart & J. McClelland, Vol. 1, 318-362. MIT Press, Cambridge, Massachusetts,
USA.
Sambou, S. & Thirriot, C. (1993) Algorithme non récursif et récursif: applicaton à la prévision des crues
du haut-bassin du Fleuve Sénégal. In: Hydrology of Warm Humid Regions, ed J. Stuart Gladwell,
139-148. IAHS Publ. no. 216.
Singh, K. & Majumdar, M. (1993) A modified two-level estimator for real time forecasting. Hydrol. Sci.
J. 38(5), 417-430.
Sirviô, H. (1989) Identification and estimation of a lake water quality model. Verh. Int Ver. Limnol.
(Congress, Munich, Germany), Vol. 24, Part 1, 698-701.
Szôllôsi-Nagy, A. (1975) An adaptative identification and prediction algorithm for the real-time forecasting
of hydrological time series. IIASA Res. Mem. RM-75-22, 1-25.

Modélisation de la relation pluie-débit

193

Tamura, H., Kutsumi, T., Nakamura, H., Seki, R., Tanabe, K. & Ozaki, 17(1988) Kalman filtering and
control of water level in an interconnected multi-reservoir power systems. In: 4ème Symp. Internat.
Ssur L'analyse des Systèmes Appliquée à la Gestion des Ressources en Eau, (Rabat, Maroc),
301-306.
Tong, H. (1990) Non-linear Time Series. A Dynamical System Approach. Clarendon Press, Oxford, UK.
Weigend, A. S., Huberman, B. A. & Rumelhart, D. E. (1992) Predicting sunspots and exchange rates with
connectionist networks. In: Nonlinear Modeling and Forecasting, ed M. Casdagli & S. Eubank,
395-432. Addison-Wesley, New York, USA.
Weigend, A. S. & Gershenfeld, N. A. (1993) Results of the time series prediction competition at the Santa
Fe Institute. In: Proc. IEEE Intern. Conf. on Neural Networks, (San Francisco, California, USA),
1786-1793.
Reçu 27 mars 1995; accepté 22 septembre 199S


Documents similaires


Fichier PDF reseaux connexionnistes
Fichier PDF coursmodelisationcalage2010 140502130402 phpapp02
Fichier PDF hf0204 corrige
Fichier PDF application des reseaus de neuronnes formels
Fichier PDF gr2m 1
Fichier PDF courskarstapprochesmethodomodelesreservoirsarfibm2


Sur le même sujet..