L'archivage des sites Web - Webmaestro - Gouvernement du Québec

Les pages HTML constituant l'interface Web d'un programme offert en PES sont
généralement peu nombreuses. Au coeur ..... Dans l'exercice normal de ses
responsabilités, le détenteur principal du document aura procédé, le cas échéant
, au dépôt légal et statué sur le traitement à lui faire subir au moment de l'
archivage.

Part of the document


L'archivage des sites Web
au gouvernement du Québec
Éléments de problématique
v3.3 Note liminaire - Le présent document se termine sur quelques propositions
de bonnes pratiques applicables à la conservation des sites Web mais il
faut dire dès le début que les normes sont ici largement en avance sur les
technologies et que les solutions logicielles d'archivage commencent à
peine à apparaître sur le marché. Il se peut que vous éprouviez quelque
difficulté à trouver des outils en mesure de réaliser concrètement
l'archivage. L'essentiel du présent document concerne plutôt
l'explicitation de la problématique.
Introduction Au gouvernement du Québec, au-delà de quelques initiatives locales, la
question de l'archivage des sites Web a principalement été abordée dans le
cadre d'une vaste réforme de la gestion de l'information qui est pilotée
par la Direction générale des Archives de BAnQ[1] et connue sous le nom de
Cadre de référence gouvernemental en gestion intégrée des documents
(CRGGID).
Le contexte général de la problématique : le CRGGID L'initiative du CRGGID procède du constat selon lequel, plusieurs années
après le déploiement d'Internet à l'échelle de la planète, une partie
croissante de l'information gouvernementale est créée, gérée et utilisée
sans plus nécessairement passer par l'impression sur papier. Or les
politiques, règlements et procédures en vigueur dont l'objet est d'assurer
une saine gestion de l'information ont pratiquement tous été élaborés en
présumant que l'information était véhiculée sur papier et qu'en gérant le
support, on pouvait adéquatement gérer le contenu. De plus, le rythme de
remplacement des technologies d'entreposage et de diffusion de
l'information numérique est tel qu'il ajoute à la difficulté d'en assurer
la gestion et la conservation à long terme alors même que le volume de
l'information à conserver s'accroît continuellement. Par ailleurs, en vertu d'une dynamique indépendante, l'adoption par la
société de ces nouveaux modes de communication entraîne un certain nombre
de conséquences que les autorités doivent reconnaître dans les lois,
règlements et pratiques de l'État. Ainsi, la valeur juridique des
communications numériques est maintenant reconnue par la Loi concernant le
cadre juridique des technologies de l'information, même si elle crée des
difficultés d'authentification inédites dans l'univers du papier.
Également, il devient de plus en plus évident que les lois assurant la
transparence de l'État, en donnant accès à l'information gouvernementale à
tous les citoyens, ne doivent pas être contredites par les insuffisances du
système de gestion des documents, un domaine où, à l'évidence,
l'informatique devrait exceller. Il y a donc lieu de s'assurer d'une gestion efficace de documents
numériques au même titre que les documents papiers. Mandatés pour fournir une solution à ce problème, les responsables du
dossier ont rapidement reconnu la nécessité de créer un système en mesure
de gérer l'information durant toute sa durée de vie et intégrant
l'information sur supports numérique et papier. Cette double intégration
est maintenant connue sous l'appellation de Gestion intégrée des documents. Par durée de vie, il faut entendre une gestion intégrée allant de la
création initiale d'un document numérique jusqu'à sa destruction définitive
ou son archivage à long terme pour le bénéfice des chercheurs et des
historiens, en passant par les étapes habituelles que sont la période de
l'utilisation active du document et celle de sa conservation intégrale pour
satisfaire aux exigences administratives, juridiques ou financières de
l'administration. La solution envisagée au CRGGID, dont les détails sont encore en cours
d'élaboration, reposera sur une utilisation massive des technologies les
plus récentes. L'information gouvernementale de l'avenir sera entreposée
dès sa création, par le mécanisme de l'enregistrement institutionnel, dans
des voûtes virtuelles permanentes et sécurisées où elle sera appelée à
demeurer toute sa durée de vie. Toutes les exploitations qu'on en fera
seront indirectes, par référence à l'original entreposé dans la voûte.
Toutes les manipulations auxquelles on pourra la soumettre se feront au
moyen d'une longue liste de métadonnées[2], Les systèmes informatiques sur lesquels reposera cette architecture feront,
autant que possible, usage de normes ouvertes et de formats de données
libres de toute attache juridique ou commerciale. Il sera ainsi possible de
développer des bibliothèques de composantes logicielles partageables et
réutilisables par tous, ce qui devrait faciliter et accélérer l'adoption
généralisée du système.[3] Du point de vue du CRGGID, un site Web est constitué d'informations
gouvernementales qui doivent être conservées de façon adéquate durant leur
durée de vie active et semi-active et, éventuellement, être échantillonnées
pour un archivage à long terme. C'est la question qui va occuper le reste
de ce document.
Une distinction majeure : L'information versus la prestation électronique
de service (PES) Avant toute chose, il nous faut dissiper une ambiguïté majeure et, par la
même occasion, clarifier quelque peu la portée du présent guide sur
l'archivage des sites Web. Ce qu'on appelle couramment un site Web désigne en fait deux grandes
variétés d'objets accessibles à travers un fureteur Web qui diffèrent
totalement quant à leur raison d'être, leurs modes d'opération et leurs
objectifs. La première est constituée par les sites qui ont pour vocation
d'informer le public en diffusant une information plus ou moins ciblée mais
fondamentalement publique. La seconde est constituée par les sites dits de
prestation électronique de service (PES) qui entreprennent au contraire de
dialoguer sur une base individuelle avec leur clientèle. Ces deux
catégories d'objets appellent un traitement complètement différent en
matière de conservation et d'archivage au point que le deuxième devra faire
l'objet d'un guide indépendant. Un site Web ordinaire a pour but d'informer le public et se présente comme
une vitrine où l'organisation étale diverses informations offertes à tout
venant. Sa conservation relève de la Gestion documentaire et se traite
comme une variété particulière de documents d'information. Un site de PES, au contraire, est un mode d'accès à un programme ou un
service gouvernemental qui prend place aux côtés de l'accès par téléphone,
par la visite à un préposé, par télécopieur ou par la poste. Loin de
présenter la même information à tout le monde, le site de PES traite
individuellement avec chacun des clients qui se présentent, échangeant avec
eux des informations personnelles et confidentielles qui ne sont
accessibles à personne d'autre. On n'archive pas, dans ce cas, des
documents publics. On archive les dossiers confidentiels de l'État. Le fait que les sites de PES soient accessibles à travers un fureteur et
qu'ils ressemblent beaucoup, par conséquent, à un site Web, est totalement
superficiel. Les pages HTML constituant l'interface Web d'un programme offert en PES
sont généralement peu nombreuses. Au coeur de l'application, on trouve un
petit nombre de formulaires électroniques permettant au client de
s'identifier, de loger une demande de prestation, de consulter son dossier,
de le mettre à jour, etc. En appui à cette fonction, on peut trouver des
pages décrivant le programme, ses conditions d'admissibilité, etc. On peut
aussi trouver des pages d'aide pour aider le client à interpréter les
questions des formulaires. Enfin, l'application peut être associée à divers
documents à caractère juridique destinés à fixer le cadre d'utilisation du
service offert: des politiques de confidentialité, des ententes quasi-
contractuelles du genre "En soumettant un formulaire dûment complété, le
requérant affirme respecter toutes les conditions... libérer le
gouvernement de toutes responsabilités...." Dans la PES, la partie de loin la plus importante est la base de données où
s'accumulent les informations formant les dossiers des clients ou des
bénéficiaires du service, conjointement avec les programmes informatiques
qui traitent l'information pour rendre le service. Ces programmes et bases
de données ont été créés dans le respect minutieux des règles du service
offert: les conditions d'admissibilité, les dates, échéances et périodes de
validité, les conditions à respecter, les pièces justificatives requises,
etc. Les quelques pages qui forment collectivement l'interface du service
sur Internet sont totalement subordonnées à ces règles, aux logiciels de
traitement des dossiers et, surtout, aux bases de données contenant les
dossiers des clients ou bénéficiaires. Par conséquent, ce sont les règles établies pour la conservation des
dossiers clients et autres documents relatifs aux programmes de l'État qui
doivent présider à l'archivage de la partie Web du programme. L'application
de ces règles sont la responsabilité des gestionnaires d'opérations qui
assurent la prestation du programme ou du service, quel que soit le mode
d'accès choisi par la clientèle. Voilà pourquoi les sites de PES ne seront
pas couverts par ce guide, lequel ne saurait en aucune façon faire autorité
à leur sujet. Ceci dit, on peut quand même ajouter, pour information seulement, que
l'archivage de la partie Internet d'un programme de PES devrait être
beaucoup plus facile que celle d'un site Web d'information. Ces quelques
pages, en effet, ne sont pas appelées à connaître de fréquents changements.
En principe, elles ne devraient être modifiées qu'à l'occasion d'un
amendement au programme lui-même, lequel doit être reflété dans le
formulaire en ligne et dans les pages décrivant le programme en détails.
Ceci ne se produit pas très souvent. Il est donc relativement facile de
garder des copies des pages chaque fois qu'elles subissent des changements
et cette mesure devrait suffire à tous les besoins.