Tous les billets avec l'étiquette informatique de gestion

Arènes loties d'Arles par J.B. Guibert - 18e siècle via Wikimedia Commons

Les travaux récents d’Anaphore

Les textes précédemment publiés sur ce blog rendaient principalement compte d’une partie du travail de veille d’Anaphore.
Mais, l’activité d’Anaphore ne se limite pas à la veille. Des chantiers, nombreux et importants, sont conduits, les uns déjà terminés, d’autres en cours. Ces chantiers ne sont pas, bien entendu, sans rapport avec ce travail de veille et les liens entre les différentes composantes de notre activité devraient progressivement apparaitre clairement.
Ce blog doit aussi rendre compte de nos travaux. Ce premier texte va en faire une présentation globale et partielle. Par la suite, nous aurons l’occasion de présenter plus en détail ces différents chantiers.

Des évolutions nécessaires

Arkhéïa et Anaphore sont au service des archivistes et des archives depuis plus de deux décennies. Le temps d’accumuler des expériences et de voir des contextes évoluer. Contexte technique, contexte administratif, contexte concurrentiel… qu’il faut prendre en compte. Mais, Anaphore n’entend pas se contenter de s’adapter à ces changements, elle tient également à anticiper des évolutions encore plus fondamentales dont vont bénéficier les métiers d’accès à l’information. Et c’est à cet égard, en particulier, que le travail de veille est essentiel.

Des évolutions dans plusieurs directions

Nous travaillons sur l’interface et l’ergonomie d’Arkhéïa, en particulier le module Thésaurus et les modules de gestion.
De nombreux travaux sont en cours concernant les descriptions de documents d’archives. Anaphore a consacré de nombreuses années à offrir la possibilité de saisir tous types d’instruments de recherche sur tous types de documents, sans pour autant négliger les possibilités de restitution de ces instruments de recherche. Les travaux plus récents portent particulièrement sur ces possibilités de restitution.

L’interface d’Arkhéïa

Anaphore a fait appel à une agence spécialisée dans le graphisme et l’ergonomie (La Souris verte) afin de mettre au point une nouvelle interface pour Arkhéïa. Il s’agissait de disposer d’une présentation plus agréable, plus moderne, mais aussi plus ergonomique, plus intuitive.
L’agence a proposé une architecture plus fonctionnelle des fenêtres, des menus et boutons ; des icônes ont été spécifiquement dessinées.
C’est donc un travail de refonte qui a été entrepris, un chantier de longue haleine. Actuellement, les petits modules Accueil, Paramétrage et Acteurs sont fonctionnels. Le module Récolement est en phase d’achèvement et le module Thésaurus est bien avancé.
Le module Récolement déconnecté, qui a été utilisé et très apprécié par les archives départementales du Gard à l’occasion de leur déménagement, a également été refondu depuis.

Ci-dessous, un exemple de la nouvelle interface avec le module Thésaurus.
InterfaceThesaurus

La restitution des instruments de recherche

Les instruments de recherche sont parmi les productions à plus grande valeur ajoutée des archivistes qui leur consacrent beaucoup de leurs compétences, de leur temps et de leur énergie. Il est essentiel que les résultats soient lisibles, compréhensibles et, autant que possible, agréables !
Anaphore attache une grande importance à la qualité des instruments de recherche. Il ne faut pas, ce qui est malheureusement souvent le cas, qu’informatisation rime avec appauvrissement. Car la mise en ligne d’instruments de recherche électroniques présente souvent des limites : la navigation peut être laborieuse, on a difficilement une vue et une compréhension globales du fonds… ; et, pour autant, les performances et l’ergonomie des recherches ne sont pas optimisées.

A.  Des possibilités d’impression de grande qualité

Nous avons déjà présenté ici les possibilités de génération de fichiers directement imprimables. Disponible depuis la fin de l’année 2013, cette fonction a été largement adoptée, et parfois avec un certain enthousiasme.

B.  Une nouvelle page HTML

Tous les instruments de recherche ne peuvent pas être imprimés, ni même ne méritent de l’être. Internet est indubitablement aujourd’hui un moyen de diffusion privilégié.
Notre objectif était donc de permettre la consultation en ligne de véritables instruments de recherche. En 2011, Anaphore avait déjà produit un export HTML de qualité avec l’aide d’une agence web (Glanum). En 2014, un nouveau chantier a été lancé pour une nouvelle présentation des instruments de recherche. La feuille de route étant, en particulier, la suivante :

  • Permettre l’affichage à l’écran de l’ensemble d’un instrument de recherche (et pas seulement d’une petite partie à la fois) afin de pouvoir le faire défiler.
  • Obtenir une présentation lisible, agréable, adaptée à l’écran et moderne.
  • Réduire considérablement le poids de la page, malgré les contraintes ci-dessus afin d’offrir des temps de chargement courts.
  • Adapter automatiquement l’affichage à tout type d’appareil, dont les tablettes et même les smartphones (on dit web adaptatif ou responsive web design).
  • Optimiser le référencement des informations contenues dans les instruments de recherche.

ExportHTML

La recherche dans les instruments de recherche

Nous avons eu l’occasion de présenter, dans ce blog, les principales caractéristiques des moteurs de recherche de troisième génération conçus pour les bibliothèques. Ces caractéristiques sont également très intéressantes pour les instruments de recherche archivistiques. Toutefois, leur adaptation ne va pas de soi et nécessite une très bonne connaissance des problématiques, une réflexion approfondie et une stratégie fine, compte tenu de la grande complexité de cette question (description et indexation à niveaux avec gestion de l’héritage, variabilité des métadonnées descriptives versus la régularité pour les bibliothèques…).
Anaphore n’avait pas pris directement en charge le développement de logiciels de recherche et de navigation, mais est à l’origine des premières réalisations pour les archives (ActionArchives et Pleade).
Le moteur Bach, aujourd’hui opérationnel, bénéficie de toutes ces réflexions et expériences, ainsi que de longs mois de développements. Il offre des fonctionnalités et une ergonomie totalement inédites pour l’interrogation de nos instruments de recherche archivistiques.
Bach

Vers le web sémantique

D’une part, le mouvement vers les données liées est inexorablement en marche. Les grandes bibliothèques s’y sont résolument engagées, comme la Bibliothèque nationale de France (BNF). C’est aussi le cas, en France, de l’Agence bibliographique de l’enseignement supérieur (ABES).
Pour les archives, l’intérêt du web des données est largement aussi vif que dans le cas des bibliothèques (voir, par exemple la présentation d’Anila Angjeli au congrès annuel 2012 de la SAA).

D’autre part, après les bibliothécaires (avec les modèles FRBR, FRAD…) et bien d’autres, les archivistes sont conscients de l’impérieuse nécessité d’un modèle global. Voir, par exemple, les travaux du Conseil international des archives sur la révision des normes de description et l’élaboration d’un modèle conceptuel pour les archives.
En effet, pour diverses raisons historiques (qu’il n’est pas question de remettre en cause), les choses ont été un peu faites à l’envers en commençant par rédiger des normes, par établir des formats standard et par produire des outils informatiques, sans avoir une vision globale des entités concernées par nos descriptions et sans avoir explicité les relations qu’elles entretiennent entre elles.
Pour Anaphore, il ne serait pas raisonnable, aujourd’hui, d’envisager l’avenir et de faire évoluer les logiciels de description sans cette vue globale.
Anaphore s’est beaucoup documentée sur ces questions, a étudié plusieurs modèles ou ontologies (Europeana Date Model, Locah-Liking Lives, Salda, Finnish Conceptual Model for Archival Description, l’ontologie de l’APUG à Rome…) et suit de près les travaux sur l’évolution des formats (schémas EAC, EAD 3, Nomina…) et ceux du Conseil international des archives.
Néanmoins, pour ses besoins internes et afin de faire évoluer ses outils d’une manière cohérente et tournée vers l’avenir, Anaphore a travaillé, en collaboration avec Sparna à l’élaboration d’un modèle conceptuel pour décrire les fonds d’archives. Notons qu’Anaphore a pris le parti de nommer les classes et propriétés en français.
Ontologie2

Nous vous donnons rendez-vous sur notre blog où nous développerons les points abordés ci-dessus. À bientôt.

Numérisation et informatisation (Part II)
Entre codification des contenus et informatisation des processus

Notre billet précédent présentait, en introduction, « raison graphique » et « raison computationnelle ». Il s’agissait, dans cette première expression, de fixer un cadre discursif pour les questions et hypothèses qui vont suivre.

Revenons tout d’abord sur le titre « Numérisation et informatisation » proposé pour ces billets et sur lequel nous ne nous sommes que peu attardés jusqu’à maintenant. De quoi s’agit-il ici ? En effet, lorsque, dans notre métier, nous parlons de numérisation, nous nous référons le plus souvent soit aux campagnes de transformation de documents papiers en images numériques, soit à la transformation d’instruments de recherche en objet numérique en vue de leur encodage dans un format normalisé.

Numérisation

Nous aimerions ici revenir sur l’essence même du terme numérisation et des implications qu’il induit. Lorsque que l’on numérise, on réduit un objet réel en un ensemble de nombres pour le rendre manipulable par une machine informatique. En d’autres termes, numériser consiste à construire une représentation discrète (ou discrétisation) d’un objet rendu manipulable (ou manipulation). De ce fait, comme l’explique Bachimont, le numérique possède deux propriétés essentielles : « la manipulation machinale », dans le sens où tout contenu codé ou discrétisé devient manipulable par une machine ou un programme ; « l’arbitraire sémantique, puisque la discrétisation aboutit à un code indépendant du sens et de la nature du contenu numérisé. » Le numérique étant, en conséquence, le résultat d’un processus à la fois « calculatoire et arbitraire par rapport à l’interprétation et à l’exploitation » du contenu ainsi représenté. À plus forte raison, il implique la nécessité d’une posture intellectuelle particulière parce qu’il transforme notre rapport aux contenus mais aussi notre manière de les élaborer et de les exploiter. [1]

Le numérique, dans le contexte de nos échanges au quotidien, et le numérique, comme intermédiation pour l’accès aux contenus culturels et intellectuels, relève de plusieurs logiques proposées par les termes « informatisation » et « numérisation ». L’informatisation s’inscrit dans une démarche de modélisation à des fins opérationnelles, cette démarche porte sur les processus. La numérisation, comme nous venons de le voir concerne la codification des contenus.

Informatisation

Informatiser un service d’archives (ceci étant valable pour n’importe quel domaine) suppose « une étude préalable des processus à prendre en compte, la conception de solutions pour mimer les étapes de ces processus et, autant que possible, les optimiser, puis la réalisation d’une solution logicielle pour répondre à ces besoins. Dans le cas des archives, les processus sont nombreux, les pratiques très variées suivant les types de services et donc les besoins à prendre en compte également. »[2]

Dans le cadre de l’informatisation des services d’archives, plusieurs volets sont donc à prendre en compte :

  • un premier vise à permettre le suivi de la gestion matérielle des documents, c’est-à-dire, le suivi du déplacement des documents de l’entrée au service des archives à leur communication éventuelle en salle de lecture. Cette démarche relève de ce que l’on nomme communément l’informatique de gestion.
  • un second consiste à « identifier et expliquer le contexte et le contenu des documents d’archives en vue de faciliter leur accès »[3]. Il s’agit ici du traitement intellectuel des contenus. Démarche moins souvent explicitée, qui relève de l’informatique documentaire.

Dans le contexte de l’accès aux contenus archivistiques, on pourrait effectivement parler d’un troisième volet découlant du deuxième, celui de la mise en ligne, c’est-à-dire de la conception des outils de médiation et d’accès aux contenus pour les professionnels et les publics.

En amont de ces volets on trouve la collecte qui, quant à elle, relève autant de l’informatique de gestion que de l’informatique documentaire puisqu’il s’agit à la fois de suivre le parcours matériel des documents mais aussi d’en consigner le contenu afin d’en planifier le traitement dans le temps. L’informatisation procède donc bien d’une « démarche théorique où l’on pense un processus pour ensuite le construire, la numérisation d’une démarche pratique où l’on réalise un objet technique pour ensuite comprendre ses possibilités. »[4]

La démarche de l’informatisation continue de s’imposer pour ce qui concerne la gestion matérielle des documents, en d’autres termes la modélisation du processus métier.

On pourrait se risquer à dire que, jusqu’à l’émergence, voire la prise en considération réelle par les archivistes des normes puis des formats standard de la description archivistique, l’informatisation de la description des contenus, c’est-à-dire, de la production des métadonnées descriptives, s’est bornée à reproduire avec l’informatique ce que faisait l’archiviste manuellement pour classer et rédiger ses instruments de recherche. D’abord par la production manuscrite, puis avec le dactylogramme pour les faire imprimer et ensuite par l’usage du traitement texte. L’inventaire ainsi produit était pensé pour et par lui-même, de l’introduction à l’élaboration du sommaire et de l’index.

L’avènement des normes, l’évolution des formats et le mouvement vers une convergence numérique, tant pour la production des contenus que pour leur consultation par les publics, a produit, petit à petit, un basculement de la pratique vers une toute autre démarche, celle que nous supposons produite par ce que Bruno Bachimont a nommé la raison computationnelle.

Raison graphique, raison computationnelle

Pour rappel, la raison graphique repose sur le principe que la parole a été inscrite sur un support matériel entraînant l’introduction des deux éléments fondamentaux que sont la permanence et la spatialité. Éléments essentiels à une construction rationnelle nouvelle, c’est-à-dire à l’émergence d’une structure de signification donnant à voir et à comprendre une rationalité inexprimable par la seule parole (tableau à deux dimensions).

Ainsi, « toute structure rationnelle devant reposer en son principe sur un support matériel, permanent et spatial », la raison computationnelle, pour sa part, nous confronte à un nouveau type de support, un support dynamique dont la synthèse est calculée.

En fixant un rapport dans le temps, le calcul donne comme virtuellement présent ce qui ne l’est pas encore, ce qui le sera au terme du calcul. Le calcul est par conséquent un nouveau mode d’être ensemble… [5]

En conséquence, l’informatique en tant que nouveau « mode d’être ensemble » fait émerger de nouvelles structures conceptuelles. Sans en connaître encore toutes les ramifications – nous ne sommes en effet qu’au début de ce nouveau rapport –  il est néanmoins possible de tirer quelques observations pour ce qui est du propos qui nous intéresse, à savoir la production d’instruments de recherche normalisés.

En effet, partant du postulat proposé par Bruno Bachimont, on pourrait interroger l’hypothèse d’une modification de nos modes de pensée en termes de production et de mise en œuvre de nos instruments de recherche dans le nouveau contexte de médiation que constitue le numérique.

De l’instrument de recherche isolé au corpus d’instruments de recherche

Le tableau ci-après propose quelques éléments intéressant ce nouveau contexte de production.

Un processus de production nécessaire

Notre propos ici est d’émettre l’hypothèse que, peut-être, la prise en compte, dans le processus de production, des divers éléments proposés dans ce tableau, a pu affecter et donc faire évoluer notre rapport à la production. La prise en compte de la notion de corpus, nous « forçant » à penser au-delà du seul instrument de recherche produit isolément pour et par lui-même mais plutôt en relation avec l’ensemble des autres existants ou à venir pour donner corps à ce que l’on pourrait appeler « une unité électronique objectivable », c’est-à-dire un ensemble numérique qui ferait sens comme structure informationnelle rendue réelle et effective par la virtualisation.

L’idée étant de souligner ici que c’est le processus lui-même qui engendre la modification de notre rapport au processus-même de production. C’est parce que l’on serait confronté au « faire » que notre rapport au processus de production serait modifié et, en conséquence, à même d’évoluer dans une nouvelle rationalité dynamique et calculée parce que laissant émerger des rapports jusque là insoupçonnés.

Ainsi, on a pu voir émerger la nécessité de définir des procédures de production avec pour objectif principal la tentative de concevoir ce fameux corpus ou structure informationnelle réelle et effective qui ferait sens, c’est-à-dire, interrogeable de façon transversale, navigable et cohérent pour tout un chacun. Nous pourrions nous référer ici à l’idée d’une « intentionnalité éditoriale » issue de la raison computationnelle.

Car le « faire sens » de cette nouvelle rationalité virtuelle semble se construire à la fois par l’harmonisation des processus de production qui affectent tant la forme que le fond (c’est-à-dire les modes des descriptions, le nommage, etc.), par la définition des clés d’accès au contenu, définition qui par ailleurs doit pouvoir évoluer dans le temps pour maintenir « l’intelligibilité culturelle » et par la définition technologique pour prévenir tout « fossé d’obsolescence », c’est-à-dire, l’incapacité de maintenir la lisibilité technique du corpus dans le temps [6].

Dans un troisième et dernier billet nous poursuivrons notre réflexion sur la production des instruments de recherche et son évolution dans le contexte du changement de paradigme induit par la raison computationnelle.


  1. Bruno Bachimont, Ingénierie des connaissances et des contenus : le numérique entre ontologies et documents. Paris, Lavoisier, 2007, pp. 23-24.
  2. Louis Colombani, texte non publié.
  3. Norme internationale de la description archivistique ISAD(G).
  4. B. Bachimont, Ingénierie des connaissances et des contenus : le numérique entre ontologies et documents. p. 25.
  5. B. Bachimont, « Intelligence artificielle et écriture dynamique : de la raison graphique à la raison computationnelle », 1996, pp. 12-18.
  6. Nous reviendrons sur ces notions dans un autre billet.