La première étape, qui peut aussi être comprise comme une sorte d’étape préliminaire, consiste à regrouper toutes les informations nécessaires. Il s’agit de déterminer les éléments permettant de caractériser les documents originaux, les objectifs de la numérisation, les ressources disponibles, et éventuellement certaines conditions spéciales.
— Déterminer les caractéristiques des documents originaux est évidemment nécessaire pour définir l’aspect technique de la numérisation, et en particulier le format des images numérisées. Parmi les éléments importants se trouvent la couleur (noir-blanc, niveaux de gris, couleur) et le contraste des documents originaux, le type de document (textuel, iconographique, etc.), et la finesse des détails.
— La numérisation peut répondre à deux objectifs principaux. Il peut s’agir de diffuser un ou plusieurs documents de manière facilitée, ou il peut s’agir de prendre une mesure de conservation pour préserver au mieux un document nécessitant un traitement particulier. Et en mettant les choses au pire, un document numérique peut remplacer un document original dont l’existence est menacée à court terme. Dans ce dernier cas, il est important de réaliser que le remplacement se fait au prix d’une perte importante puisqu’une image numérique ne peut être qu’une approximation du document original.
— Les ressources à disposition jouent évidemment un rôle important aussi. Il est nécessaire d’en dresser un inventaire, quel que soit le type (ressources en finances, personnel, temps, infrastructure, organisation, etc.).
— Enfin, il peut arriver qu’il soit nécessaire de tenir compte de conditions spéciales, qui sont aussi susceptibles d’apparaître dans la suite du processus de choix.
Durant la deuxième étape, il s’agit de déterminer si les images numériques doivent être conservées pour le long terme ou non, en s’appuyant sur les informations mises en évidence lors de la première étape.
En raison du coût de la numérisation et en raison de l’intérêt des documents numérisés, les images sont souvent produites pour être conservées pour une durée sans limite dans le temps. Il est à noter qu’il y a alors deux cas différents. D’une part, on peut se trouver dans le cadre de l’archivage à long terme, qui nécessite un système d’archivage de haute qualité. Il va de soi que les documents numériques dont le rôle est de remplacer des documents originaux en dégradation rapide doivent bénéficier d’un tel système. D’autre part, il peut s’agir de documents qui ne sont pas destinées à l’archivage mais qu’il est tout de même nécessaire de conserver pour le long terme. C’est le cas des documents numériques destinés uniquement à la diffusion, parce que seuls les documents originaux sont archivés, ou parce que l’institution concernée archive parallèlement des copies numériques de haute qualité.
Mais il peut aussi arriver que les documents numérisés ne soient pas conservés au-delà d’une date bien définie et proche dans le temps. Par exemple, lorsqu’une institution offre un service de numérisation au public, il peut être jugé que les images créées dans ce cadre ne présentent pas un intérêt suffisant pour nécessiter une conservation à long terme. Alternativement, le coût de la conservation du document original et du document numérique peut être considéré comme trop important pour permettre la conservation du document numérique, sachant que le document original peut être numérisé une deuxième fois si nécessaire.
Il est nécessaire de déterminer si les images seront en noir/blanc ou non. En effet, certains formats et certains algorithmes de compression sont spécifiquement conçus pour des images en noir/blanc, respectivement pour des images en couleur. Ainsi, la méthode de compression Groupe 4 est spécifiquement conçue pour les images en noir/blanc, alors que les algorithmes de compression JPEG et JPEG 2000 peuvent être utilisés uniquement pour les images en couleur.
Quatrième étape: les images ne sont pas conservées pour le long terme S’il n’y a pas d’exigence particulière, un bon choix est de produire des images TIFF avec compression Groupe 4 (images noir-blanc à caractère textuel), des images TIFF avec compression LZW (images noir-blanc sans caractère textuel) ou des images JPEG avec niveau de compression d’environ 8/12 sur l’échelle de Photoshop 34(images en couleur).
Au contraire, s’il y a des besoins spéciaux, alors le format le mieux adapté doit être choisi, quel qu’il soit. En effet, puisque les images ne doivent être conservées que pour une courte période, il n’y a pas besoin de prendre en compte la question de la durabilité de ces images. Il suffit de produire des images répondant parfaitement au besoin du moment.
Quatrième étape: les images, uniquement destinées à la diffusion, sont conservées pour le long terme
Lorsque les images ont la diffusion pour seuls buts, alors les formats et les méthodes de compression conseillés sont les mêmes qu’au point ci-dessus, à savoir des images TIFF avec compression Groupe 4 (images noir/blanc à caractère textuel), des images TIFF avec compression LZW (images noir/blanc sans caractère textuel) ou des images JPEG avec niveau de compression d’environ 8/12 sur l’échelle de Photoshop (images en couleur). Mais comme il y a un objectif de conservation à long terme, il est déconseillé d’utiliser un autre format ou une méthode de compression différente sans une évaluation approfondie.
Essentiellement, il y a deux cas possibles. Il peut s’agir d’images dérivées à partir d’images archivées de haute qualité. Mais il peut aussi s’agir d’images pour lesquelles il n’existe pas de copies d’archivage. En effet, une institution peut décider de créer des images exclusivement destinées à la diffusion, en s’appuyant sur le fait que les documents à archiver sont les documents «papier» originaux. Comme exemple d’un tel cas, nous avons déjà vu l’exemple des AEG.
Quatrième étape: les images sont destinées à l’archivage
Lorsque l’on choisit de créer des images avec un objectif d’archivage à long terme, il faut déterminer si l’institution concernée veut, ou non, utiliser un algorithme de compression. De manière générale, la compression est vue comme un élément à éviter autant que possible dans le domaine de l’archivage à long terme. Pour cette raison, le standard de fait est le format TIFF sans compression. Toutefois, devant la masse des images produites actuellement et dans le futur, de nombreuses institutions se tournent vers l’utilisation de la compression.
Si une institution renonce à utiliser le format TIFF sans compression, alors il est recommandé d’utiliser TIFF avec compression Groupe 4 (images noir/blanc à caractère textuel), TIFF avec compression LZW (images noir/blanc sans caractère textuel) et JPEG 2000 sans perte de qualité (images en couleur).
Le choix d’un format d’images pour un projet de numérisation: commentaires concernant l’arbre de décision
Conditions spéciales
Il peut arriver qu’une institution soit soumise à des conditions spéciales. Ainsi, les Archives nationales d’Australie n’acceptent pas le format TIFF comme format d’archivage, en raison de son développement par une entreprise unique qui en a gardé la propriété (Aldus, aujourd’hui reprise par Adobe). Les Archives nationales d’Australie ont par conséquent choisi le format PNG comme format d’archivage. 35
Читать дальше