WeRead Powered by ReaderPub
De l'imprimé à Internet cover

De l'imprimé à Internet

Chapter 11: 8. LES CATALOGUES EN LIGNE
Open in WeRead

About This Book

The study examines how printed publishing and related professions adapt to the rise of the Web, combining a literature review with interviews and a contemporary survey. It surveys technical context and usage trends, maps online developments in bookselling, publishing, newspapers, libraries and catalogues, and describes emerging cyberlibraries and digital services. It reports professionals' experiences and expectations, and discusses intellectual property, electronic editions, multimedia convergence and multilingualism. Organized by topical chapters plus glossary, document and site selections, it offers a momentary overview of transitions and practical perspectives for stakeholders navigating the shift from paper-centered workflows to networked information environments.

La sélection mensuelle de janvier 1998 était Les Déliquescences, poèmes
décadents d'Adoré Floupette (1885), une oeuvre de Henri Beauclair et Gabriel
Vicaire. Les mois précédents avaient vu passer des oeuvres de Théophile Gautier,
Vivant Denon, Jean Lorrain, Charles Nodier, Ernest Lavisse, Jean Revel, Charles
Rabou, Claire de Duras, Xavier Forneret, Ernest Renan, Joris-Karl Huysmans,
Philarète Chasles, Emile Gaboriau, Georges Eekhoud, Prosper Mérimée, Stendhal,
Denis Diderot, Gaston Leroux, Marc de Montifaud, etc.

Le rayon littéraire présente une collection de pages consacrées principalement aux auteurs du 19e siècle: des nouvelles de Jean Lorrain, Guy de Maupassant, Alphonse Allais, Octave Mirbeau, Remy de Gourmont, Jules Barbey d'Aurevilly, Isabelle Eberhardt, Charles Asselineau, Marcel Schwob, Jean Richepin, Eugène Mouton, Jean de La Ville de Mirmont, Léon Bloy, des lettres de Gustave Flaubert, ainsi que des bibliographies et des travaux du lycée Marcel Gambier de Lisieux. Dans le quotidien Libération du 17 avril 1998, Olivier Bogros, directeur de la bibliothèque, racontait:

"En me baladant sur un BBS [bulletin board service], j'ai vu qu'on s'échangeait des textes. Je me suis dit qu'on pouvait rassembler en local tout ce qui traînait comme textes électroniques et les mettre à disposition des lecteurs. […] Les francophones qui ne trouvent pas un texte ou une référence à la bibliothèque de la Réunion, des Italiens qui font des études de français et cherchent tel poème de Mallarmé, un Japonais en quête d'un nom latinisé, un éditeur anglais qui cherche des documents sur les maisons en bois… On a reçu des mails du monde entier."

Quel est l'historique de ce site qui suscite beaucoup d'intérêt dans le monde francophone parce qu'il montre ce qui est faisable avec beaucoup de détermination et des moyens limités? Dans son courrier électronique du 18 juin 1998, Olivier Bogros expliquait:

"Le site La bibliothèque électronique de Lisieux a été ouvert en juin 1996. Hébergé sur les pages personnelles, limitées à 5 Mo, de mon compte CompuServe, il est depuis quelques jours [début juin 1998] installé sur un nouveau serveur où il dispose d'un espace disque plus important (15 Mo) et surtout d'un nom de domaine. Les frais inhérents à l'entretien du site sont à ma charge, la ville finance de manière indirecte le site en acceptant que tous les textes soient choisis, saisis et relus par du personnel municipal sur le temps de travail (ma secrétaire pour la saisie et une collègue pour la relecture). Ce statut étrange et original fait de La bibliothèque électronique de Lisieux le site presque officiel de la Bibliothèque municipale, tout en restant sous mon entière responsabilité, sans contrôle ni contrainte.

J'ai déjà rapporté dans un article paru dans le Bulletin des Bibliothèques de France [1997, n° 3, article en ligne] ainsi que dans le Bulletin de l'ABF [Association des bibliothécaires français] [1997, n° 174, sommaire en ligne], comment l'envie de créer une bibliothèque virtuelle avait rapidement fait son chemin depuis ma découverte de l'informatique en 1994 : création d'un bulletin électronique d'informations bibliographiques locales (Les Affiches de Lisieux) en 1994 dont la diffusion locale ne rencontre qu'un très faible écho, puis en 1995 début de la numérisation de nos collections de cartes postales en vue de constituer une photothèque numérique, saisie de nouvelles d'auteurs d'origine normande courant 1995 en imitation (modeste) du projet de l'ABU [Association des bibliophiles universels] avec diffusion sur un BBS [bulletin board service] spécialisé. L'idée du site Internet vient d'Hervé Le Crosnier, enseignant à l'université de Caen et modérateur de la liste de diffusion Biblio-fr, qui monta sur le serveur de l'université la maquette d'un site possible pour la Bibliothèque municipale de Lisieux, afin que je puisse en faire la démonstration à mes élus. La suite logique en a été le vote au budget primitif de 1996 d'un crédit pour l'ouverture d'une petite salle multimédia avec accès public au réseau pour les Lexoviens [habitants de Lisieux]. Depuis cette date un crédit d'entretien pour la mise à niveau des matériels informatiques est alloué au budget de la bibliothèque qui permettra cette année la montée en puissance des machines, l'achat d'un graveur de cédéroms et la mise à disposition d'une machine bureautique pour les lecteurs de l'établissement…. ainsi que la création en ce début d'année d'un emploi jeune pour le développement des nouvelles technologies."

Une autre initiative intéressante est celle de Bibelec (Bibliothèque électronique des étudiants), réalisée par les étudiants de Sciences-Po (Institut d'études politiques, Paris). Lors de sa création, elle se définissait comme la première cyberbibliothèque française en sciences sociales exclusivement réalisée par des étudiants.

Professeur de français, de littérature française et d'applications informatiques à Tokyo (Japon), Patrick Rebollar utilise l'ordinateur pour la recherche et l'enseignement depuis plus de dix ans. En 1994, il a vu apparaître Internet "dans le champ culturel et linguistique francophone" et il a débuté son site web en 1996. Son site comprend notamment une excellente Chronologie littéraire 1848-1914, qui est organisée année après année. Pour chaque année, outre des liens avec le texte intégral des oeuvres publiées cette année-là, on trouve des notes historiques, politiques et sociales, des informations scientifiques, médicales et technologiques, et des informations sur le monde littéraire.

Dans son courrier électronique du 17 juillet 1998, Patrick Rebollar expliquait:

"Pour la Chronologie littéraire, cela a commencé dans les premières semaines de 1997, en préparant un cours sur le roman fin de siècle (19e). Je rassemblai alors de la documentation et m'aperçus d'une part que les diverses chronologies trouvées apportaient des informations complémentaires les unes des autres, et d'autre part que les quelques documents littéraires alors présents dans le Web n'étaient pas présentés de façon chronologique, mais toujours alphabétique. Je fis donc un document unique qui contenait toutes les années de 1848 à 1914, et l'augmentais progressivement. Jusqu'à une taille gênante pour le chargement, et je décidai alors, fin 1997, de le scinder en faisant un document pour chaque année. Dès le début, je l'ai utilisé avec mes étudiants, sur papier ou sur écran. Je sais qu'ils continuent de s'en servir, bien qu'ils ne suivent plus mon cours. J'ai reçu pas mal de courrier pour saluer mon entreprise, plus de courrier que pour les autres activités Web que j'ai développées."

Une des autres activités de Patrick Rebollar sont ses Bookmarks, répertoire très complet des sites francophones, y compris littéraires.

Situé à l'autre bout du monde, à l'Université de Swarthmore (Pennsylvanie, USA), ClicNet est un site culturel et littéraire francophone qui propose 800 liens à des oeuvres de littérature par ordre alphabétique et par sujet, et 2.500 liens à des ressources francophones.

Des bibliothèques numérisent aussi leurs collections anciennes d'images, ce qui permet à celles-ci d'être consultées par tous et non plus seulement par un petit nombre d'élus du fait de la valeur et de la fragilité des originaux. La Bibliothèque municipale de Lyon par exemple met ses enluminures à la disposition du public. Constituée aujourd'hui de 3.000 images, sa collection d'enluminures présentera à terme plus de 10.000 images correspondant à 200 manuscrits et incunables, sur une période allant du 5e siècle à la Renaissance. Le système utilisé est le SGBI (Système de gestion de banques d'images) créé par la Maison de l'Orient à Lyon, sous l'égide du CNRS (Centre national de la recherche scientifique) et de l'Université Lyon 2.

"Chaque document, signalé par son auteur, son titre et son siècle de réalisation, représente une entité. Par un double clic sur l'entité choisie, on accède à un écran qui permet de feuilleter les images du document. Chaque écran peut comporter 9 imagettes, correspondant à des objets-images. Lorsque le document comporte davantage d'objets-images, des flèches permettent d'accéder aux objets-images suivants. Chaque objet-image peut comprendre plusieurs images, leur nombre étant indiqué sous chaque objet-image. Un double-clic sur une imagette permet de voir l'image agrandie. Dans une seconde étape, une interrogation multicritères sera possible."

Des bases de données textuelles sont accessibles par abonnement payant, par exemple FRANTEXT et l'ARTFL Project.

FRANTEXT, présent sur le Web depuis début 1995, est préparé par l'Institut national de la langue française (INaLF), une branche du CNRS (Centre national de la recherche scientifique). La base comprend, en mode interactif, 180 millions de mots-occurrences résultant du traitement informatique d'une collection représentative de 3.500 unités textuelles en arts, sciences et techniques couvrant cinq siècles (16e-20e siècles). Début 1998, 82 centres de recherche et bibliothèques universitaires d'Europe, d'Australie, du Japon et du Canada étaient abonnés, ce qui représentait 1.250 postes de travail ayant accès à FRANTEXT. Le nombre de sessions d'interrogations de la base était d'une cinquantaine par jour.

Christiane Jadelot, ingénieur d'études à l'INaLF-Nancy, expliquait dans son courrier électronique du 8 juin 1998:

"Les premières pages sur l'INaLF ont été mises sur l'Internet au milieu de l'année 1996, à la demande de Robert Martin, directeur de l'INaLF. Je peux en parler, car j'ai participé à la mise sous Internet de ces pages, avec des outils qui ne sont pas comparables à ceux que l'on utilise aujourd'hui. J'ai en effet travaillé avec des outils sous UNIX, qui n'étaient pas très faciles d'utilisation. Nous avions peu d'expérience de la chose, à l'époque, et les pages étaient très verbeuses. Mais la direction a senti la nécessité urgente de nous faire connaître par l'Internet, que beaucoup d'autres entreprises utilisaient déjà pour promouvoir leurs produits. Nous sommes en effet Unité de recherche et de service et nous avons donc à trouver des clients pour nos produits informatisés, le plus connu d'entre eux [étant] la base textuelle FRANTEXT. Il me semble que la base FRANTEXT était déja sur Internet [depuis début 1995], ainsi qu'une maquette du tome 14 du TLF [Trésor de la langue française]. Il était donc nécessaire de faire connaître l'ensemble de l'INaLF par ce moyen. Cela correspondait à une demande générale."

Comme l'indique Christiane Jadelot, l'INaLF prépare également la version en ligne du Trésor de la langue française (TLF) (Jean Nicot, 1606), dont une maquette est disponible sur le Web pour les lettres Q à S. L'oeuvre complète du TLF est disponible sur le site de l'ARTFL Project, avec recherche textuelle possible par mot ou portion de texte.

Dans son courrier électronique du 11 juin 1998, Arlette Attali indiquait les changements qu'Internet a apporté dans sa vie professionnelle:

"Etant moi-même plus spécialement affectée au développement des bases textuelles à l'INaLF, j'ai été amenée à explorer les sites du Web qui proposaient des textes électroniques et à les "tester". Je me suis donc transformée en 'touriste textuelle' avec les bons et mauvais côtés de la chose. La tendance au zapping et au survol étant un danger permanent, il faut bien cibler ce que l'on cherche si l'on ne veut pas perdre son temps. La pratique du Web a totalement changé ma façon de travailler: mes recherches ne sont plus seulement livresques et donc d'accès limité, mais elles s'enrichissent de l'apport des textes électroniques accessibles sur Internet.

[A l'avenir je pense] contribuer à développer des outils linguistiques associés à la base FRANTEXT et à les faire connaître auprès des enseignants, des chercheurs, des étudiants et aussi des lycéens."

En janvier 1998, elle a mené une enquête auprès des utilisateurs de FRANTEXT en Europe, en Australie, au Japon et au Canada pour mieux connaître ses utilisateurs. Les résultats de cette enquête sont disponibles en ligne.

L'ARTFL Project (ARTFL: American and French Research on the Treasury of the French Language) est un projet commun du CNRS (Centre national de la recherche scientifique, France) et de l'Université de Chicago (Illinois, USA), qui vise à constituer une base de données de 2.000 textes du 13e au 20e siècle concernant la littérature, la philosophie, les arts ou les sciences.

L'ARTFL travaille aussi à la version en ligne exhaustive de la première édition (1751-1772) de l'Encyclopédie ou Dictionnaire raisonné des sciences, des métiers et des arts de Diderot et d'Alembert. 72.000 articles écrits par plus de 140 collaborateurs (dont Voltaire, Rousseau, d'Alembert, Marmontel, d'Holbach, Turgot, etc.) ont fait de cette encyclopédie un monumental ouvrage de référence. Destinée à rassembler puis divulguer les connaissances de l'époque, elle porte la marque des courants intellectuels et sociaux du 18e siècle, et c'est grâce à elle qu'ont été propagées les idées du Siècle des Lumières.

Les chiffres sont éloquents quant à l'ampleur du travail: l'Encyclopédie comprend 17 volumes de texte et 11 volumes de planches, 18.000 pages de texte et 20.736.912 mots. La base de données correspondant au premier volume est accessible en ligne à titre expérimental. La recherche peut être effectuée par mot, portion de texte, auteur ou catégorie, ou par la combinaison de ces critères entre eux. On dispose de renvois d'un article à l'autre, et des liens permettent d'aller d'une planche au texte, ou du texte au fac-similé des pages originales. L'automatisation complète des procédures de saisie a entraîné quelques erreurs typographiques et des erreurs d'identification qui seront corrigées plus tard. La recherche d'images par mot, portion de texte ou catégorie sera également possible à l'avenir.

L'ARTFL travaille aussi à un projet de base de données pour le Dictionnaire de l'Académie française, dont les différentes éditions se sont échelonnées entre 1694 et 1935. Ce projet inclut la saisie, l'édition et le développement d'un moteur de recherche spécifique. Les différentes éditions pourront être combinées dans une seule base de données qui permettra de consulter aussi bien une édition particulière que l'ensemble de celles-ci pour juger de l'évolution d'un terme. Pour le moment, seules deux éditions, la première (1694) et la cinquième (1798) sont disponibles pour une recherche par mot. Une fonction de recherche en texte intégral est prévue par la suite.

Une rubrique présente une liste des autres projets de l'ARTFL, notamment la version image de l'édition de 1740 du Dictionnaire historique et critique de Philippe Bayle, le Roget's Thesaurus de 1911, le Webster's Revised Unabridged Dictionary de 1913, le Thresor de la langue française de Jean Nicot (1606), un projet multilingue sur La Bible comprenant La Bible française de Louis Segond (1910), etc.

7.3. Cyberbibliothèques non francophones

De par la quantité d'oeuvres dactylographiées à cette intention, le Project Gutenberg est la plus ancienne et la plus grande cyberbibliothèque qui existe. Créée en 1971 par Michael Hart aux Etats-Unis, elle a pour but de mettre gratuitement le plus grand nombre possible de textes à la disposition du plus grand nombre possible de lecteurs, à raison d'environ 45 titres par mois. Ses objectifs pour 2001 sont un stock de 10.000 textes littéraires et une transmission de 1.000 milliards de textes électroniques, soit 10.000 livres numériques vers 100 millions de lecteurs.

Le projet débuta en 1971 quand on donna à Michael Hart un compte de 100 millions de dollars de "temps machine" au Materials Research Lab de l'Université d'Illinois (USA). Immédiatement après avoir reçu ce crédit, il décida de le consacrer à la recherche et au stockage des oeuvres conservées dans les bibliothèques. Il décida aussi de stocker des textes électroniques de la manière la plus simple possible, en format ASCII, avec des lettres capitales pour les termes en italique, gras ou soulignés, afin que ces textes puissent être lus quels que soient la machine et le logiciel utilisés.

Cinquante heures environ sont nécessaires pour sélectionner, dactylographier, corriger et mettre en page un texte électronique. La dactylographie des textes est l'oeuvre de volontaires. Un ouvrage de taille moyenne - par exemple un roman de Stendhal ou de Jules Verne - est composé de deux fichiers ASCII.

Le Project Gutenberg inclut trois grands secteurs: la littérature de divertissement (Light Literature), comme Alice au pays des merveilles, Peter Pan ou les Fables d'Esope, la littérature "sérieuse" (Heavy Literature) comme La Bible, les oeuvres de Shakespeare ou Moby Dick, et la littérature de référence (Reference Literature), composée d'encyclopédies et de dictionnaires, par exemple le Thesaurus de Roget.

Sur le site web, Michael Hart explique que la collection de littérature de divertissement est destinée à amener devant l'écran aussi bien un enfant d'âge pré-scolaire qu'une personne du troisième âge. Des enfants ou des grand-parents vont rechercher le texte électronique de Peter Pan après avoir vu Hook au cinéma, ou bien ils lisent Alice au pays des merveilles après l'avoir regardé à la télévision. Pratiquement tous les épisodes de Star Trek ont mentionné des livres qui ont leur correspondant électronique dans le Project Gutenberg (Moby Dick, Peter Pan…). L'objectif est que les gens puissent retrouver des citations qu'ils ont entendues dans des conversations, des films, des musiques, d'autres livres, et ce à l'aide d'une bibliothèque contenant tous ces éléments dans un format facile pour la recherche.

En juillet 1997, le Project Gutenberg fêtait son vingt-sixième anniversaire avec la mise en ligne des Merry Adventures of Robin Hood de Howard Pyle. En septembre 1997, il fêtait son millième texte électronique avec la version anglaise de la Divine comédie de Dante. Dans sa lettre d'information d'octobre 1997, Michael Hart annonçait son intention de compléter la collection d'Oscar Wilde, de "séparer" les oeuvres complètes de Shakespeare en fichiers individuels pour chaque oeuvre, et de mettre en ligne des ouvrages non anglophones.

Outre l'anglais, on trouve quelques oeuvres en allemand, espagnol, français, italien et latin, mais elles ne sont pas encore légion. En janvier 1998, si on lançait une recherche sur les ouvrages disponibles en langue française, on trouvait neuf titres, dont six romans de Stendhal (L'Abbesse de Castro, La Chartreuse de Parme, La Duchesse de Palliano, Le Rouge et le Noir, Les Cenci, Vittoria Accorambani), deux romans de Jules Verne (De la terre à la lune et Le tour du monde en 80 jours) et French Cave Paintings, un ouvrage sur les peintures préhistoriques. A part l'ouvrage sur les cavernes, disponible depuis 1995, tous ces ouvrages n'ont été intégrés à la bibliothèque que début 1997. Si aucun titre de Stendhal n'était disponible en anglais, il existait trois oeuvres de Jules Verne en langue anglaise : 20,000 Leagues Under the Sea (disponible depuis septembre 1994), Around the World in 80 Days (disponible depuis janvier 1994) et From the Earth to the Moon (disponible depuis septembre 1993).

Début septembre 1998, le nombre de titres d'ouvrages en langue française était monté à onze, avec Cyrano de Bergerac, d'Edmond Rostand, disponible depuis mars 1998, et La Révolution française, de Thomas Carlyle, disponible depuis mai 1998.

Une autre importante bibliothèque électronique anglophone est The On-Line Books Page. Créée par John Mark Ockerbloom, ancien étudiant de l'Université Carnegie Mellon (Pittsburgh, Pennsylvanie, USA), elle est un répertoire de livres en accès libre sur Internet, avec un index de 7.000 livres en ligne et des liens vers d'autres répertoires et archives de textes en ligne.

Créées en été 1992 par Paul Southworth et hébergées par l'Information Technology Division de l'Université du Michigan (USA), les ETEXT Archives rassemblent des textes électroniques de toutes sortes, sans juger de leur contenu. L'équipe est entièrement composée de volontaires.

Les ETEXT Archives virent le jour pour combler le manque d'organisation observé dans les archives de documents politiques, périodiques et forums de discussion politiques et sociaux éparpillés dans Usenet, puis elles furent développées pour combler le même manque d'organisation dans l'archivage des magazines électroniques (e-zines) lorsque ceux-ci ont commencé à proliférer sur Internet.

Elles hébergent aussi gratuitement des périodiques, oeuvres de fiction, oeuvres politiques, poétiques, religieuses, etc., à la demande d'auteurs ou d'organismes souhaitant les faire connaître, après avoir sensibilisé les auteurs au respect d'une certaine éthique (pas d'ouvrages pornographiques), aux règles concernant le droit d'auteur et à l'utilisation d'un format lisible par tous (ASCII, HTML, PDF et PostScript). Par contre, le site ne propose pas de liens hypertextes avec d'autres oeuvres ou d'autres sites. Il s'en tient au but fixé, à savoir l'archivage de textes.

Proposée par Logos, une société internationale de traduction dont la maison-mère est à Modène (Italie), la Wordtheque est une bibliothèque multilingue permettant une recherche par mot dans une base de données de plus de 328 millions de termes provenant de romans, documents techniques et traductions dans de nombreuses langues. Les recherches sont possibles par langue, mot, auteur et titre. Le logiciel de recherche documentaire permet aussi l'accès au texte intégral d'oeuvres littéraires du domaine public. Si on souhaite acquérir une de ces oeuvres, un lien permet de la commander en ligne à la cyberlibrairie Amazon.com.

Entre autres outils de travail, Logos propose aussi une base de données de 553 glossaires dans Linguistic Resources, un dictionnaire multilingue de 7,5 millions d'entrées dans Multilingual Dictionary et la conjugaison des verbes en 17 langues dans Conjugation of Verbs.

Logos a été créé par Rodrigo Vergara, un réfugié politique chilien qui a émigré en Italie quand il était étudiant en agronomie pour échapper au régime du général Pinochet. Aujourd'hui, à 45 ans, il dirige une entreprise de traduction offrant des services dans plus de 35 langues, avec un réseau de 300 traducteurs dans le monde et un chiffre d'affaires de 60 millions de FF.

En décembre 1997, Rodrigo Vergara expliquait à Annie Khan, journaliste au Monde:

"Nous voulions que nos traducteurs aient tous accès aux mêmes outils de traduction. Nous les avons donc mis à leur disposition sur Internet, et tant qu'à faire nous avons ouvert le site au public. Cela nous a rendus très populaires, nous a fait beaucoup de publicité. L'opération a drainé vers nous de nombreux clients, mais aussi nous a permis d'étoffer notre réseau de traducteurs grâce aux contacts établis à la suite de cette initiative."

Dans Links to Electronic Book and Text Sites, OmniMedia Digital Publishing propose un répertoire de serveurs de livres et de textes électroniques. Première bibliothèque publique d'Internet et pour Internet, l'Internet Public Library (IPL) dispose de 20.166 documents en ligne soigneusement sélectionnés, catalogués et décrits par son personnel. La Online Book Initiative (OBI) est un projet consistant à rassembler une importante collection de textes du domaine public en format ASCII.

Créée par l'Université Carnegie Mellon (Pittsburgh, Pennsylvanie, USA), l'Universal Library a pour objectif de mettre le plus grand nombre d'ouvrages possibles à la disposition des usagers d'Internet. Elle comprend un index de plus de 5.000 oeuvres en anglais. La moitié de ces oeuvres est reliée au catalogue expérimental de la Library of Congress, si bien que - rêve enfin devenu réalité - les usagers peuvent avoir un accès direct au texte intégral de l'oeuvre à partir de la notice du catalogue.

Une très bonne série de liens vers la littérature anglophone est Literary Resources on the Net. Oeuvre de John Lynch, docteur en littérature anglaise à l'Université de Pennsylvanie (USA), le site propose des ressources littéraires en fonction des catégories suivantes : période classique et biblique, période médiévale, Renaissance, 18e siècle, période romantique, période victorienne anglaise, 20e siècle anglais et irlandais, théâtre et drame, théorie, littérature féminine et féminisme, ethnies et nationalités, autres littératures nationales, bibliographie et histoire du livre, hypertextes et divers.

La Bibliotheca universalis est un des onze projets retenus lors du Sommet du G7 des 13-17 mai 1996. Ce projet de bibliothèque électronique à l'échelon mondial "illustre la nécessité de donner à la société de l'information une ambition culturelle internationale, respectant les diversités culturelles et la pluralité linguistique". Il a "pour ambition de donner accès aux oeuvres principales du patrimoine culturel et scientifique mondial - textes, images, sons - par le biais des technologies multimédias. Il doit ainsi favoriser le dialogue culturel par-delà les frontières et améliorer les services rendus aux utilisateurs." Le projet souhaite proposer une collection universelle à partir des programmes de numérisation existants, avec environnement en réseau, système d'information distribué, fonctions de recherches avancées, et normes communes pour la numérisation des textes, des images et des sons ainsi que pour les protocoles de communication.

Ouvert en 1992, l'Electronic Text Center de l'Université de Virginie (USA) propose la combinaison d'un archivage en ligne au format SGML (standard generalized markup language) de 40.000 textes électroniques en douze langues et des 19.000 illustrations correspondant à ces textes, dont certains sont du domaine public, avec un centre comprenant le matériel informatique et les logiciels permettant la création et l'analyse de texte. French Texts and Language Resources procure des textes français en ligne et sur CD-ROM, et une série de liens menant à d'autres textes électroniques en français.

De nombreuses cyberbibliothèques sont également accessibles au moyen d'un abonnement payant, comme l'Electric Library, un centre de recherche en ligne permettant l'accès au texte intégral de 150 journaux et de centaines de magazines, 2.000 ouvrages de littérature classique, 28.000 photos, images et cartes, les transcriptions d'émissions de télévision et de radio, des résumés de livres, films et logiciels, des encyclopédies, etc., ou encore l'ACM Digital Library, créée en octobre 1997 par l'Association for Computing Machinery (ACM), organisme scientifique et de recherche international. Cette bibliothèque comprend des informations bibliographiques et des textes d'articles, ainsi qu'une section consacrée aux cyberbibliothèques et à la recherche d'information.

Ce ne sont pas seulement les textes mais aussi les images qui sont numérisés, comme on l'a vu plus haut dans Gallica, la bibliothèque numérique de la Bibliothèque nationale de France, qui a inauguré son site en 1997 par des images et textes du 19e siècle francophone.

D'autres cyberbibliothèques sont consacrées uniquement aux images, comme Corbis, société créée en 1989 par Bill Gates, patron de Microsoft. Cet ensemble d'images numériques a été constitué pour fournir des ressources d'information visuelle à l'échelon international. Parallèlement au développement de ses collections et au marketing de celles-ci, Corbis est aussi une plate-forme de recherche pour étudier les décisions à prendre en matière de normes industrielles de reproduction et de protection de la propriété intellectuelle à l'ère numérique.

Avec 25 millions d'images dont 1,4 million en ligne en décembre 1998, le fonds de Corbis est constamment enrichi par l'acquisition de droits ou la conclusion de partenariats avec de grands musées. Chaque image est accompagnée d'une légende, d'un commentaire et de mots-clés permettant une recherche thématique au moyen d'un thésaurus de 25.000 mots. La base de données est commercialisée auprès des professionnels sous forme de licences. Le grand public y a accès par Internet et par une série de CD-ROM thématiques.

Le problème majeur des bibliothèques d'images sur le Web est le temps nécessaire au téléchargement, temps proportionnel à la taille de l'image. Après avoir d'abord proposé des images "pleine page" agréables à l'oeil mais très longues à apparaître sur l'écran, de nombreux sites optent maintenant pour des images de format réduit, avec possibilité de cliquer sur ces images pour obtenir un format plus grand si nécessaire. Ce problème devrait être résolu à l'avenir avec l'augmentation de la vitesse de transmission des données.

Bien que les cyberbibliothèques anglophones soient encore très largement majoritaires, l'univers des cyberbibliothèques devient rapidement multilingue. Le Projekt Gutenberg-DE comprend plus de 200 titres de littérature allemande et de littérature étrangère en allemand. Débuté en 1992 par LYSATOR, un club informatique d'étudiants, en collaboration avec la Linköping University Library (Suède), le Projekt Runeberg regroupe 200 oeuvres de littérature nordique. Liber Liber, qui s'annonce comme la première et la plus grande bibliothèque télématique italienne, débute sa page de présentation par une maxime éloquente: "Nullus amicus magis liber quam liber." Parallèlement, les grandes cyberbibliothèques introduisent peu à peu dans leurs collections des textes en d'autres langues que leur langue dominante.

7.4. Un exemple: la toile littéraire francophone

Prise au sens large, la notion de cyberbibliothèque dépasse très largement l'ensemble des cyberbibliothèques définies comme telles. Un site littéraire est pratiquement toujours doublé d'une cyberbibliothèque. Il propose souvent le texte intégral d'oeuvres litéraires ainsi que des liens vers d'autres sites traitant de la même époque, du même auteur ou du même genre littéraire, et ainsi de suite.

On ne compte pas le nombre de sites consacrés à la littérature en général, et à la littérature francophone en particulier. On ne peut pas plus justement parler de Toile - traduction littérale du terme Web souvent adoptée par les francophones - que pour la littérature, qui sert de support à l'élaboration d'une gigantesque toile littéraire. Un passionné de littérature peut passer des journées entières à aller d'une oeuvre à l'autre et d'un site à l'autre. A l'heure actuelle, c'est la littérature du 19e et du début du 20e siècle qui est la plus fortement représentée, puisqu'une grande partie des oeuvres est du domaine public et n'est donc pas soumise au droit d'auteur et au casse-tête que la gestion de celui-ci représente encore sur le Web.

Voici quelques exemples.

CyLibris, maison d'édition sur Internet, propose une sélection de sites sur l'Internet littéraire francophone, les jeux de rôles et les journaux.

Patrick Rebollar, professeur de littérature française et d'applications informatiques à Tokyo (Japon), mène plusieurs réalisations sur le Web, par exemple la Chronologie littéraire 1848-1914. Il tient à jour une liste de signets très complète, notamment dans les domaines suivants : littérature et recherche (normes et règles, bibliothèques et éditeurs, bibliographies), revues littéraires, linguistique, dictionnaires, lexiques, recherche littéraire, documents littéraires par thèmes et par auteurs (Malraux, Sarraute, Camus, Gracq, Robbe-Grillet, etc.), oeuvres littéraires, poésie, bandes dessinées, etc.

Dans son courrier électronique du 17 juillet 1998, il expliquait:

"Animant des formations d'enseignants à l'Institut franco-japonais de Tokyo, je voyais d'un mauvais oeil d'imprimer régulièrement des adresses pour demander aux gens de les recopier. J'ai donc commencé par des petits documents rassemblant les quelques adresses web à utiliser dans chaque cours (avec Word), puis me suis dit que cela simplifierait tout si je mettais en ligne mes propres signets, vers la fin 1996. Quelques mois plus tard, je décidai de créer les sections finales de nouveaux signets afin de visualiser des adresses qui sinon étaient fondues dans les catégories. Cahin-caha, je renouvelle chaque mois. Mais les quantités de travail entraînées par le Salon du livre de Tokyo (et les interviews d'écrivains), en janvier 98, et le Festival de Yokohama (juin 1998), font qu'il y a bien longtemps que je n'ai pas fait sérieusement mon travail de veille techno-culturelle…"

Projet commun du CNRS (Centre national de la recherche scientifique, France) et de l'Université de Chicago (Illinois, USA), l'ARTFL Project (ARTFL: American and French Research on the Treasury of the French Language) est une base de données payante de 2.000 textes du 13e au 20e siècle concernant la littérature, la philosophie, les arts ou les sciences. Le site propose aussi en accès libre une intéressante liste de liens avec les serveurs de littérature française lui paraissant dignes d'intérêt.

Voici aussi quelques exemples pris dans les sites consacrés à la poésie.

Le Club des poètes est un site de poésie francophone qui souhaite la "bienvenue en territoire de poésie de la France au Chili, de Villon jusqu'à de jeunes poètes contemporains, en passant par toutes les grandes voix de la poésie de tous les temps et de tous les pays". Dans son courrier électronique du 8 juin 1998, Blaise Rosnay retraçait l'évolution de son site:

"Le site du Club des Poètes a été créé en 1996, il s'est enrichi de nombreuses rubriques au cours des années et il est mis à jour deux fois par semaine. L'Internet nous permet de communiquer rapidement avec les poètes du monde entier, de nous transmettre des articles et poèmes pour notre revue, ainsi que de garder un contact constant avec les adhérents de notre association. Par ailleurs, nous avons organisé des travaux en commun en particulier dans le domaine de la traduction. [Nos projets pour notre site sont d']y mettre encore et toujours plus de poésie. Ajouter encore des enregistrements sonores de poésie dite ainsi que des vidéos de spectacles."

Poésie française propose un choix de poèmes français de la Renaissance au début du 20e siècle. Dans son courrier du 8 juin 1998, Claire Le Parco, de la société Webnet, indiquait:

"Nous avons créé ce site lors de la création de notre société, spécialisée dans la réalisation de sites Internet et Intranet. Nous sommes des informaticiens qui aimons la poésie, et nous avions envie de montrer que poésie et Internet pouvaient faire bon ménage!"

Dans Poésie d'hier et d'aujourd'hui, Silvaine Arabo propose de nombreux poèmes, y compris les siens. Dans son courrier électronique du 8 juin 1998, elle expliquait:

"Je suis poète, peintre et professeur de lettres (13 recueils de poèmes publiés, ainsi que deux recueils d'aphorismes et un essai sur le thème: poésie et transcendance; quant à la peinture, j'ai exposé mes toiles à Paris - deux fois - et en province ). […] Pour ce qui est d'Internet, je suis 'autodidacte' ( je n'ai reçu aucune formation informatique quelle qu'elle soit ) ; j'ai eu l'an passé l'idée de construire un site littéraire centré sur la poésie: Internet me semble un moyen privilégié pour faire circuler des idées, pour communiquer ses passions aussi. Je me suis donc mise au travail, très empiriquement, et ai finalement abouti à ce site […] sur lequel j'essaye de mettre en valeur des poètes contemporains de talent, sans oublier la nécessaire prise de recul (Réflexions sur la poésie) sur l'objet considéré.

Ma vie professionnelle [en tant que professeur de lettres] n'en a pas été bouleversée puisqu'elle est indépendante de cette création sur Internet. Disons que très récemment, dans le cadre de mon activité professionnelle, j'ai fait avec mes élèves quelques ateliers de poésie et que, devant la pertinence de leurs productions, j'ai décidé de leur consacrer une page sur mon site ( rubrique Le jardin des jeunes poètes ). Je fais également un 'appel du pied' aux professeurs de lettres francophones pour qu'ils m'adressent des poèmes - qu'ils estiment réussis - de leurs élèves. Disons que ce site pourrait servir, entre autres, de motivation - donc de moteur - à la créativité des jeunes enfants ou des adolescents."

Voici encore quelques exemples pris dans des genres littéraires différents.

Théâtrales est une collection de textes et d'hypertextes en français sur le théâtre. Le site a été créé en mai 1995 par André G. Bourassa, professeur à l'Université de Québec à Montréal, et par Barry Russell, Visiting Fellow de l'Université Brookes d'Oxford.

Polar Web se présente comme le premier site francophone entièrement consacré au roman policier, avec des informations sur les manifestations autour du polar, une rubrique annonçant les nouveaux titres chez différents éditeurs, et la liste de tous les documents disponibles en texte intégral: livres, pages, articles, nouvelles et entretiens.

BD Paradisio est consacré à la bande dessinée en ligne avec dossiers, entretiens, biographies, dessins inédits et forums de discussion à thèmes.

Une Autre Terre est un site consacré à la science-fiction. Dans son courrier électronique du 9 juin 1998, Fabrice Lhomme, son créateur, expliquait:

"Le serveur a vu le jour fin novembre 1996. J'ai commencé en présentant quelques bibliographies très incomplètes à l'époque et quelques critiques. Rapidement, j'ai mis en place les forums à l'aide d'un logiciel "maison" qui sert également sur d'autres actuellement. […] Depuis [la page réalisée pour le] premier anniversaire [du serveur], le phénomène le plus marquant que je puisse noter c'est la participation de plusieurs personnes au développement du serveur alors que jusque là j'avais tout fait par moi-même. Le graphisme a été refait par un généreux contributeur et je reçois régulièrement des critiques réalisées par d'autres personnes. Pour ce qui est des nouvelles, la rubrique a eu du mal à démarrer mais une fois qu'il y en a eu un certain nombre, j'ai commencé à en recevoir régulièrement (effet d'entraînement). Actuellement, j'ai toutes les raisons d'être satisfait car mon site reçoit plus de 2.000 visiteurs différents chaque mois et toutes les rubriques ont une bonne audience. Le forum des visiteurs est très actif, ce qui me ravit. Concernant les perspectives d'avenir, j'envisage pour très bientôt d'ouvrir une nouvelle rubrique proposant des livres d'occasion à vendre avec l'ambition de proposer un gros catalogue. Eventuellement, j'ouvrirai aussi une rubrique présentant des biographies car je reçois pas mal de demandes des visiteurs en ce sens. […] Si l'activité de vente de livres d'occasion se montre prometteuse, il est possible que j'en fasse une activité professionnelle sous la forme d'une micro-entreprise."

L'actualité littéraire est présentée avec punch et humour dans ZazieWeb, revue en ligne conçue et réalisée par Isabelle Aveline, avec un graphisme d'Oliver Cornu. ZazieWeb comprend un édito, une rubrique Au fil du Net, un agenda, une revue de presse, un annuaire des sites et un self-service multimédia. Sur le site, Isabelle Aveline explique:

"ZazieWeb est un site World Wide Web professionnel et grand public indépendant, spécifiquement dédié aux libraires, éditeurs… et grand public de culture 'livre'. Conçu comme une librairie virtuelle, un espace de documentation, d'orientation et de ressources pour un public de culture 'papier' s'intéressant à Internet, il se situe aux frontières de l'écrit et de l'édition électronique. L'originalité du traitement des rubriques par rapport à un média papier étant évidemment de 'mailler' l'information avec un site sur Internet. C'est donc un site 'passerelle' vers Internet pour un public curieux et désorienté, avide de connaître ce qui se passe 'de l'autre côté de l'écran'."

Dans son courrier électronique du 8 juin 1998, elle ajoutait:

"ZazieWeb est né il y a deux ans environ: juin 96. C'était à l'époque un projet personnel qui entrait dans le cadre d'un master multimédia et que j'ai essayé de 'vendre' aux éditeurs. […] Découvrir Internet a ouvert d'autres possibilités et surtout maintenant je ne conçois pas de ne pas travailler 'on the web'!"

On assiste aussi à l'apparition de "la littérature interactive lancée par le grand écrivain américain John Updike, qui, l'an dernier, balança sur le Web le premier chapitre d'un roman que les internautes étaient censés poursuivre", expliquait Emmanuèle Peyret dans le quotidien Libération du 27 février 1998. Cette première expérience de littérature interactive a été réalisée à l'initiative de la grande cyberlibrairie Amazon.com.

Lors de la fête d'Internet des 20-21 mars 1998, ATOS et France Loisirs ont à leur tour lancé le premier roman interactif francophone, dont le premier et le huitième et dernier chapitres ont été écrits par le romancier Yann Queffélec. Le thème du roman était le suivant: "Une femme, condamnée à mort aux Etats-Unis, bénéficie d'un sursis de 30 jours accordé par le gouverneur, avant son exécution. Que va-t-elle faire de ce répit? A quoi pense-t-elle et quel message va-t-elle laisser aux partisans et aux opposants de la peine de mort?" Le premier chapitre était disponible sur le site de France Loisirs très exactement le 20 mars 1998, premier jour de la fête d'Internet. Les cybernautes disposaient de deux semaines pour proposer un deuxième chapitre. Le jury du club devait ensuite sélectionner le meilleur chapitre qui devenait la suite officielle du roman, et ainsi de suite jusqu'au 27 juillet. France Loisirs devait publier le roman en septembre 1998.

L'hégémonie de l'anglais sur le Web? Elle était inévitable à l'époque balbutiante du Web, puisque le réseau était en premier lieu américain et ensuite essentiellement anglophone, mais ce n'est plus vrai maintenant. Tous les amoureux de la langue française n'ont plus de souci à se faire, sinon à continuer le travail entrepris, et peut-être aussi oeuvrer aussi bien pour un Web francophone que pour un Web multilingue, comme le Club des poètes, qui offre une présentation de son site en anglais, en espagnol et en portugais.

7.5. L'avenir des cyberbibliothèques

"Qu'il me suffise, pour le moment, de redire la sentence classique: 'La bibliothèque est une sphère dont le centre véritable est un hexagone quelconque, et dont la circonférence est inaccessible'."

Cette citation de Jorge Luis Borges pourrait parfaitement convenir aux cyberbibliothèques.

A court ou à long terme, leur développement rapide va certainement amener à définir la place de la cyberbibliothèque, toute récente, par rapport à la bibliothèque multicentenaire, tout comme la bibliothèque traditionnelle doit maintenant redéfinir ses fonctions du fait de l'existence des cyberbibliothèques.

La British Library par exemple n'envisage pas une bibliothèque qui devienne uniquement "cyber", et elle souhaite garder son importance à la communication physique des imprimés, manuscrits, partitions musicales, bandes sonores, etc., tout en ayant conscience de la nécessité du développement parallèle des documents numériques. Tout comme la British Library, nombreux sont ceux qui pensent que la bibliothèque réelle ne va pas disparaître parce que la cyberbibliothèque existe, de même que le livre physique ne va pas disparaître parce que son équivalent numérique existe.

"On ne peut pas, on ne pourra pas tout numériser. A terme, une bibliothèque virtuelle ne sera jamais qu'un élément de l'ensemble bibliothèque", soulignait Jean-Pierre Angremy, président de la Bibliothèque nationale de France, dans un article du Figaro du 3 juin 1998. Dès 1992, la BnF avait lancé un très important programme de numérisation, et une partie des collections numérisées est maintenant disponible sur le serveur Gallica.

Pierre Perroud, fondateur de la cyberbibliothèque Athena, expliquait dans Informatique-Informations de février 1997 que "les textes électroniques représentent un encouragement à la lecture et une participation conviviale à la diffusion de la culture", notamment pour la recherche textuelle et l'étude des textes. Il pense que ces textes "sont un bon complément au livre imprimé - celui-ci restant irremplaçable lorsqu'il s'agit de lire". S'il est persuadé de la nécessité de suivre de près l'évolution technologique et d'y adapter le monde du livre et celui de l'enseignement, il n'empêche que le livre reste "un compagnon mystérieusement sacré vers lequel convergent de profonds symboles: on le serre dans la main, on le porte contre soi, on le regarde avec admiration; sa petitesse nous rassure autant que son contenu nous impressionne; sa fragilité renferme une densité qui nous fascine; comme l'homme il craint l'eau et le feu, mais il a le pouvoir de mettre la pensée de celui-là à l'abri du Temps."

Il est vrai que, outre l'accès direct à de très nombreuses oeuvres du domaine public, l'existence des cyberbibliothèques facilite grandement la recherche textuelle sur une ou plusieurs oeuvres à la fois. Par exemple, les bases de données constituées par l'ARTFL Project permettent une recherche textuelle sur l'Encyclopédie de Diderot et d'Alembert ou le Dictionnaire de l'Académie française. Menés par plusieurs organismes, de nombreux autres projets sont en cours pour l'étude de La Bible, La Divine Comédie de Dante, l'ensemble des oeuvres de Shakespeare, etc., et ces projets permettront de disposer de bases de données incluant à la fois les textes et leurs commentaires sur plusieurs siècles.

La consultation sur écran de livres anciens offre également d'immenses perspectives. Elle permettra aux chercheurs de les visualiser et de mieux sélectionner ceux qui les intéressent avant de demander la consultation de certains originaux. Les perspectives sont grandes aussi pour les bibliothèques d'images, dans lesquelles enluminures, gravures, affiches, cartes postales, photos et films sont ou seront disponibles sur écran. Pour le moment, le temps de déchargement d'une image est encore assez long, mais cet inconvénient devrait bientôt disparaître avec l'augmentation de la vitesse de transmission des données.

Le problème majeur auquel se heurte la cyberbibliothèque à l'heure actuelle est celui du droit d'auteur. Ce problème - qui ne concerne pas seulement le livre, la revue ou l'image, mais aussi la musique, les arts graphiques, les logiciels, etc. - est fébrilement étudié par les auteurs, éditeurs, journalistes, etc.

Comment élargir la cyberbibliothèque à toutes les oeuvres et ne plus la limiter aux oeuvres du domaine public comme c'est le cas maintenant? Comment mettre en ligne les oeuvres soumises au droit d'auteur tout en respectant la législation concernant la propriété intellectuelle? Ce problème, qui concerne les cyberbibliothèques, les librairies, les éditeurs ou la presse en ligne, sous-tend le développement d'Internet dans le domaine culturel et, toujours dans le domaine culturel, son utilisation maximale comme outil de connaissance et de communication.

Un problème plus pratique est celui de l'harmonisation des formats informatiques, afin de rendre possible la lecture de tout document électronique quels que soient l'ordinateur ou le logiciel utilisés. Comme nombre de cyberbibliothèques numérisant en mode texte, le Project Gutenberg conseille l'utilisation du format ASCII (American standard code for information interchange).

Cyberbibliothèque francophone gérée par l'Association des bibliophiles universels, l'ABU donne les neuf conseils suivants aux volontaires souhaitant dactylographier des textes: 1) pas de mise en page, seulement du texte avec des lignes d'environ 70 caractères et des sauts de ligne, 2) des sauts de ligne avant chaque paragraphe, y compris pour les dialogues, 3) la transcription du tiret long accompagnant les dialogues par deux petits tirets, 4) des majuscules pour les titres, noms de chapitres et sections, avec un soulignement fait de petits tirets, 5) la transcription des mots en italique par des blancs soulignés, 6) pas de tabulation, mais des blancs, 7) la mise des notes de l'auteur entre crochets et dans le corps du texte, 8) facultativement, la pagination de l'édition originale entre crochets, 9) l'encodage final en ISO-Latin-1.

Dans L'édition savante à l'ère de la bibliothèque virtuelle: publication d'un livre en SGML sur le World Wide Web, mémoire de maîtrise en bibliothéconomie et sciences de l'information (MBSI) de l'Université de Montréal (Québec) daté de novembre 1996, Guy Teasdale répertorie tous les formats utilisés pour la communication d'un texte électronique. Le plus utilisé est le texte en format ASCII (American standard code for information interchange), pour que celui-ci puissent être lu par tous les systèmes et sur toutes les machines. On a aussi des textes formatés à partir d'un traitement de texte tel que WordPerfect ou Word, des textes en format RTF (rich text format), format créé par Microsoft, des textes de type PostScript ou PDF (portable document format) créés par Adobe, des hypertextes formatés en HTML (hypertext markup language), pour lequel Microsoft ou Netscape proposent des ajouts correspondant à leurs propres logiciels de navigation. On a enfin des textes en format SGML (standard generalized markup language), qui correspond à la norme ISO-8879:1986, format dont l'auteur démontre les avantages par rapport aux autres pour l'édition électronique de monographies spécialisées.

Guy Teasdale montre également le danger que représente l'édification d'"une tour de Babel numérisée". L'utilisation de tous ces formats est en effet assez inquiétante alors qu'un des objectifs du Web est justement de permettre la circulation de l'information à travers des réseaux hétérogènes, d'où la nécessité d'adopter un langage qui ne soit pas affecté par les nombreux changements informatiques à venir.

Etant donné le développement rapide des cyberbibliothèques sur Internet, de nombreux organismes publics et privés s'y intéressent de très près et mènent des recherches approfondies souvent disponibles en ligne. Ces organismes sont notamment la British Library et la Library of Congress, deux bibliothèques nationales pilotes dans ce domaine, ou encore la Bibliothèque de l'UC Berkeley (UC: University of California) avec son site SunSITE (financé en partie par Sun Microsystems), sur lequel elle monte ses collections et services tout en procurant informations et conseils.

Le projet Digital Library Technology (DLT) soutient le développement de nouvelles technologies permettant de faciliter l'accès public aux informations de la NASA (National Aeronautics and Space Administration) par les réseaux informatiques, particulièrement les technologies développant outils, applications, matériel informatique et logiciels permettant de répondre à l'évolution des besoins des usagers et à l'augmentation énorme des demandes d'accès.

Le Stanford Digital Libraries Project fait partie de la Digital Library
Initiative, lancée en 1994 pour quatre ans et soutenue par la NSF (National
Science Foundation), la DARPA (Defense Advanced Research Projects Agency) et la
NASA (National Aeronautics and Space Administration).

Le serveur Library 2000 présente l'histoire du projet du MIT Laboratory for Computer Science (MIT: Massachussets Institute of Technology) entre octobre 1995 et octobre 1997. L'objectif de Library 2000, projet de recherche sur les systèmes informatiques, était d'étudier le stockage en ligne à grande échelle en utilisant comme exemple la future bibliothèque électronique. Il s'agissait d'un projet pragmatique, qui a permis de développer un prototype utilisant la technologie et les configurations de systèmes économiquement viables en l'an 2000.

Financé par la DARPA (Defense Advanced Research Projects Agency), D-Lib Magazine est un magazine de recherche sur les cyberbibliothèques, qui comprend l'actualité mensuelle, des commentaires, des discussions et des ressources pour la recherche.

Organisme international indépendant à destination des bibliothécaires du monde entier, l'International Federation of Library Associations and Institutions (IFLA) consacre une passionnante section aux collections et services électroniques.

8. LES CATALOGUES EN LIGNE

[Dans ce chapitre:]

[8.1. Catalogues de bibliothèques francophones / 8.2. Catalogues de bibliothèques non francophones / 8.3. Catalogues collectifs mondiaux / 8.4. L'avenir des catalogues en ligne]

Pourquoi un chapitre entier sur les catalogues? Parce que, dans le domaine de l'imprimé, le catalogue correspond au cerveau chez l'être humain. Il permet de répertorier et présenter les documents de manière systématique. Que l'on soit professionnel du livre, étudiant, chercheur ou cybernaute voulant se documenter sur un sujet donné, l'utilisation du catalogue est une étape indispensable pour trouver les documents souhaités.

Par le passé, on a pu reprocher aux catalogues d'être austères, peu conviviaux, et surtout de donner les références du document mais en aucun cas l'accès à son contenu. Depuis qu'ils sont disponibles sur Internet, les catalogues sont moins austères et plus conviviaux. Et surtout - rêve de tous qui commence à devenir réalité - ils vont progressivement permettre l'accès aux documents eux-mêmes. Ceci est déjà vrai dans certains cas, comme par exemple 2.500 oeuvres de l'Universal Library accessibles par le biais de l'Experimental Search System (ESS) de la Library of Congress.

Le souci de mettre en place des catalogues collectifs ne date pas d'hier. Pendant des décennies, les bibliothécaires et documentalistes ont catalogué le même ouvrage au même moment dans leur propre bibliothèque, d'abord dans des registres reliés, ensuite dans des catalogues sur fiches. Quand ils en avaient les moyens, leur catalogue était imprimé pour être diffusé à l'échelon régional, national ou international. L'ère des catalogues sur fiches fut longue et elle n'a pas encore disparu. Les salles entières de catalogues sur fiches rangés dans de multiples tiroirs en bois - la salle des catalogues de la Bibliothèque publique et universitaire de Genève par exemple - ont fait et font toujours l'admiration de tous. Par contre l'informatique a rapidement rendu obsolètes les machines qui dupliquaient les fiches cartonnées ou encore les sociétés prestataires de services vendant des fiches cartonnées à partir d'une liste de ISBN (international standard book number).

Depuis bientôt vingt ans, suite à l'informatisation progressive de tous les services, de nombreuses tentatives plus ou moins réussies ont permis aux bibliothécaires d'unir leurs forces au lieu d'effectuer le même travail en de multiples exemplaires.

En France par exemple, le Catalogage national centralisé (CANAC) a été suivi de Libra, un logiciel en temps réel proposé par la Direction du livre et de la lecture, qui a lui-même été suivi par le Catalogue collectif national des publications en série (CCN-PS), un réseau coopératif de catalogage sur SIBIL (Système intégré pour les bibliothèques universitaires de Lausanne) et par le Pancatalogue, dérivé du OCLC Online Union Catalog, explique Thierry Samain dans L'accès aux catalogues des bibliothèques par Internet.

Nombreuses sont aussi les bibliothèques qui ont utilisé le catalogue sur CD-ROM de la Bibliothèque nationale de France pour "récupérer" les notices de la BnF et les intégrer à leur propre catalogue. Avec Internet, on aborde enfin une nouvelle étape qui, si elle n'est pas sans difficultés, résoud le problème majeur de la communication au plus grand nombre.

Dans ce chapitre, on présentera d'abord quelques catalogues et répertoires de catalogues francophones. On présentera ensuite les catalogues de très grandes bibliothèques comme ceux de la Library of Congress ou de la British Library, ainsi que deux catalogues collectifs mondiaux qui constituent des "réservoirs" de notices pour les professionnels du livre. On abordera enfin l'avenir des catalogues sur Internet, un futur qui semble assez prometteur puisqu'il rendra plus accessible et donc plus familier un univers jusque là réputé pour son aridité.

8.1. Catalogues de bibliothèques francophones

Le site web de la Bibliothèque nationale de France ne propose pas encore ses catalogues Bn-Opale (livres et périodiques) et Bn-Opaline (collections spécialisées) en libre accès sur le Web. Ces catalogues sont disponibles moyennant un abonnement à Telnet, un système permettant d'utiliser son micro-ordinateur comme un simple terminal afin de pouvoir consulter le catalogue à distance de la même manière que si on se trouvait sur place.

On peut par contre consulter directement sur le Web le Catalogue des imprimés en libre accès, qui donne le signalement de 430.000 documents de référence imprimés et audio-visuels accessibles au public dans les nouveaux locaux de Tolbiac, inaugurés en 1996.

Bn-Opale contient plus de deux millions de références correspondant aux collections suivantes: les livres entrés par dépôt légal, achat, don ou échange depuis 1970, les périodiques entrés par dépôt légal, abonnement, don ou échange depuis 1960, les ouvrages anonymes des 16e-18e siècles (catalogue en cours de constitution), les microformes de sauvegarde commercialisées par le Service de la reproduction, et les documents informatiques depuis 1994. Bn-Opale inclut aussi le catalogue partagé avec des bibliothèques universitaires ou spécialisées, le catalogue partagé du dépôt légal en relation avec les bibliothèques régionales habilitées au dépôt légal pour l'édition régionale, la production de la Bibliographie nationale française (livres, publications officielles et publications en série, soit au total 48.000 références par an).

Bn-Opale n'inclut pas les notices d'ouvrages antérieurs à 1970 et de périodiques antérieurs à 1960. Celles-ci ne sont pour le moment disponibles que sur le CD-ROM du Catalogue général des Imprimés de la Bibliothèque nationale de France.

La base Bn-Opaline comprend des documents spécialisés (cartes, plans, estampes, etc.) entrés par dépôt légal, achat, don et échange, des microformes établies par le Centre de Sablé et des documents entrés dans les bibliothèques partenaires de la Bibliothèque nationale de France. La répartition des notices bibliographiques est la suivante: 82.377 cartes et plans depuis 1987, 54.928 estampes et photographies depuis 1988, 281.068 documents audiovisuels depuis 1989, 35.076 partitions musicales depuis 1991, 4.944 monnaies et médailles depuis 1994, et 1.655 documents concernant les arts du spectacle depuis 1995.

Depuis plusieurs années, un certain nombre de catalogues de bibliothèques publiques sont disponibles sur le Minitel, ce qui permet leur consultation dans nombre de foyers et de lieux publics. La consultation est possible soit directement sur un Minitel, soit sur un micro-ordinateur utilisé en émulation Minitel. Les notices ne peuvent cependant pas être affichées de manière détaillée, et le mode "feuilletage" ne peut pas être utilisé sur un grand nombre d'écrans successifs, ce qui explique l'attrait que représente le transfert progressif de ces catalogues sur Internet où ces fonctions sont possibles.

Comme les bases Bn-Opale et Bn-Opaline de la Bibliothèque nationale de France, un grand nombre de catalogues - y compris ceux des bibliothèques universitaires - sont maintenant disponibles par le biais de Telnet. Un code d'accès et un mot de passe permettent de se connecter à l'OPAC (online public access catalogue) de la bibliothèque. Telnet, malgré les services considérables qu'il a rendu et qu'il rend encore, présente des inconvénients du fait du fonctionnement différent de chaque OPAC, des configurations différentes de claviers, etc. La formule de l'accès libre sur le Web adoptée par la British Library ou la Library of Congress par exemple est évidemment beaucoup plus pratique.

Un autre système est l'accès des catalogues par WAIS (wide area information server). Ce système est utilisé pour les bibliothèques de laboratoires et d'unités de recherche dans le domaine scientifique et technique. Ses principaux avantages sont "un accès réparti à différents catalogues, un mode d'interrogation simple, un coût nul, le logiciel étant facilement disponible dans le domaine public, une technique ne nécessitant pas de gros investissements", explique Thierry Samain dans L'accès aux catalogues des bibliothèques par Internet.

Du fait de l'essor d'Internet, un nombre croissant de bibliothèques est en train d'établir un accès direct et gratuit à leur catalogue à partir de leur site web, moyennant une interface spécifique. L'accès direct par le Web offre de nombreux avantages, à commencer par celui de l'utilisation de la souris. L'usager a le choix entre au moins deux types de recherche, simple et avancée, et il peut sélectionner plusieurs critères complémentaires tels que le nombre d'enregistrements souhaités ou bien le mode de classement. Il peut dérouler plusieurs pages de notices abrégées ou complètes. Les notices sélectionnées peuvent être copiées, imprimées, sauvegardées ou bien envoyées par messagerie électronique. Des liens hypertextes permettent de passer facilement d'une recherche à une autre. On peut également intégrer au catalogue des images, extraits sonores ou bandes vidéo.

La meilleure formule serait l'utilisation à grande échelle de la norme Z39.50, norme nationale américaine utilisée par exemple pour la consultation du catalogue de la Library of Congress. La norme Z39.50 définit un protocole pour la recherche documentaire d'un ordinateur à un autre. L'utilisateur d'un système peut ainsi rechercher des informations chez les utilisateurs d'autres systèmes utilisant la même norme, sans devoir connaître la syntaxe de recherche utilisée par ces systèmes. L'Union européenne a entrepris des recherches pour favoriser l'utilisation de cette norme en Europe.

Parallèlement à ces améliorations techniques, on voit se développer des catalogues collectifs visant à faire connaître les ressources disponibles à l'échelon régional, national et international.

Situé sur le site de la Bibliothèque nationale de France, le Catalogue collectif de France (CCFR) permet de "trouver des informations détaillées sur les bibliothèques françaises, leurs collections et leurs fonds (anciens, locaux ou spécifiques), connaître précisément les services qu'elles rendent et interroger leur catalogue en ligne". A compter du premier trimestre 1999, il permettra aussi de "localiser des ouvrages (documents imprimés, audio, vidéo, multimédia) dans les principales bibliothèques et demander le prêt ou la reproduction des documents" qui seront remis à l'usager dans la bibliothèque de son choix.

Plusieurs réseaux régionaux ont également vu le jour. Voici trois exemples.

Né en 1988, le réseau BRISE (Bibliothèques en réseau informatisé de Saint-Etienne) dispose d'un catalogue collectif pour les bibliothèques municipales et celles des établissements d'enseignement supérieur.

Le Pôle européen universitaire et scientifique de Grenoble a mis en place REDOC (Réseau documentaire du site de Grenoble), disponible sur le Web avec des liens hypertextes entre le serveur commun et les services répartis, le but étant de donner accès aux catalogues et aux collections électroniques des bibliothèques et centres de documentation de l'agglomération grenobloise.

D'autres réseaux se sont développés avec consultation des catalogues et autres services, par exemple le Réseau des bibliothèques des universités de Toulouse, le Réseau IRIS pour la Région Provence-Alpes-Côte d'Azur ou encore RéVOdoc, le réseau documentaire du Val-d'Oise.

Plusieurs répertoires ont été créés pour accéder aux sites et aux catalogues des bibliothèques françaises et francophones. Proposé par l'Ecole nationale supérieure des sciences de l'information et des bibliothèques (ENSSIB) et réalisé par Thierry Samain, le répertoire des catalogues de bibliothèques francophones est classé en plusieurs rubriques: bibliothèques générales, arts, droit et économie, lettres et sciences humaines, médecine, sciences de l'information et bibliothèques, sciences et techniques. Plusieurs autres répertoires de catalogues sont recensés dans Sitebib, qui est le résultat de la coopération entre sites web en bibliothéconomie et sciences de l'information.

8.2. Catalogues de bibliothèques non francophones

Deux catalogues, celui de la British Library et celui de la Library of Congress, constituent d'excellents outils bibliographiques pour les cybernautes du monde entier.

En mai 1997, la British Library a lancé OPAC 97, un catalogue en ligne permettant l'accès libre et gratuit aux catalogues de ses principales collections à Londres et à Boston Spa. Rassemblées depuis 250 ans, ces collections représentent 150 millions de documents appartenant à toutes les civilisations, dans toutes les langues et dans tous les domaines.

Les catalogues présents dans OPAC 97 concernent notamment les livres et périodiques du Royaume-Uni et de l'étranger, la collection des humanités et des sciences sociales depuis 1975, notamment un fonds oriental, un fonds hispanique et une des plus grandes collections européennes sur l'Europe de l'Est et la Russie, la collection des sciences et technologies et du monde des affaires depuis 1975, la collection de musique depuis 1980, la collection de périodiques britanniques et étrangers depuis 1700 (500.000 titres) et la collection de compte-rendus de conférences depuis 1800 (la plus grande collection mondiale).

A l'heure actuelle, ces différentes collections ont chacune leur propre catalogue, correspondant souvent à un domaine spécifique. Le Corporate Bibliographic Programme (CBP) étudie la création d'une seule base de données, à la fois pour un meilleur développement des collections et pour une meilleure utilisation du catalogue par les usagers. Le même programme étudie aussi le remplacement des systèmes informatiques actuels - qui ont maintenant vingt ans - par un système plus performant à la fois pour les besoins de la bibliothèque et pour la coopération avec ses nombreux partenaires.

Le catalogue de la Library of Congress est le plus grand catalogue en ligne du monde, et sa consultation est gratuite, avec menus de consultation en anglais et en espagnol. On y trouve les références de documents dans de très nombreuses langues, y compris en français.

La recherche s'effectue au moyen de la norme Z39.50 et suivant quatre procédés: recherche par mots, recherche par liste, recherche par commandes par le biais de Telnet pour la connexion à LOCIS (Library of Congress Information System), et recherche par l'Experimental Search System (ESS).

La recherche par mots peut s'effectuer à deux niveaux: recherche simple et recherche avancée.

La recherche simple est effectuée par titre (tout ou partie du titre, du sous-titre ou de la mention de responsabilité) ou par auteur personnel (un seul auteur). Elle permet l'accès aux principaux catalogues de la Library of Congress: le catalogue des livres, les catalogues des documents informatiques (notices bibliographiques des logiciels et documents en langage informatique), les catalogues des documents en cours de traitement, les catalogues JACKPHY (notices bibliographiques des publications en caractères autres que les caractères romains: japonais, arabe, chinois, coréen, persan, hébreu et yiddish), le catalogue des manuscrits, le catalogue des cartes, le catalogue de la musique, le catalogue des périodiques et le catalogue des documents visuels, soit environ 6,3 millions de notices.

La recherche avancée permet la combinaison de critères multiples à l'aide d'opérateurs boléens (and, or, and not, correspondant aux opérateurs boléens français: et, ou, sauf).

Le moyen le plus rapide de trouver un document est l'utilisation du LCCN (Library of Congress control number), de l'ISBN (international standard book number) ou de l'ISSN (international standard serial number). Si on ne dispose pas d'un de ces nombres, on peut combiner les éléments suivants: titre, auteur personnel, auteur collectif, collection, sujet ou note, en utilisant un mot, une liste de mots ou une expression. Un mot est défini comme un groupe de caractères sans espace. Une liste de mots est définie comme deux ou plusieurs mots séparés par un espace, sans exigence concernant l'ordre des mots. Une expression est définie comme un ou plusieurs groupes de caractères séparés par des espaces et dans lesquels l'ordre des mots doit être respecté.

La recherche avancée donne accès au catalogue des autorités pour les noms et les sujets (environ 4 millions de notices en 1997), le National Union Catalog (publications cataloguées par d'autres bibliothèques et non encore intégrées aux collections de la Library of Congress) et le catalogue PreMARC (notices cataloguées antérieurement aux dates officielles auxquelles les différents catalogues ont débuté).

La recherche par liste permet une première sélection au moyen d'un index alphabétique des termes utilisés dans les catalogues de la Library of Congress: livres, périodiques (magazines, journaux et autres publications paraissant de manière régulière et continue), documents cartographiques (cartes, atlas, etc.) et microformes. Les renvois utilisés dans la recherche par sujet sont également indiqués dans l'index alphabétique. On peut effectuer la recherche par sujet, auteur (personnel ou collectif), nom de conférence, titre, nom de périodique, classification de la Library of Congress (qui correspond à une partie de la cote) ou numéro de la classification décimale de Dewey. On peut également rechercher le "numéro d'identité" exact du document, par exemple l'ISBN (international standard book number), l'ISSN (international standard serial number) ou le LCCN (Library of Congress control number).

La Library of Congress a également lancé l'Experimental Search System (ESS), qui est un système permettant de consulter tout un ensemble de catalogues grâce une seule interface composée de plusieurs pages de recherche (simple, avancée, par nombre ou par liste) et plusieurs pages de résultats (avec une liste de notices abrégées ou bien des notices complètes), en liaison avec des fichiers d'aide en ligne. Son but est de favoriser une recherche plus intuitive que celle du traditionnel OPAC (online public access catalogue), grâce à la synergie entre le lien de l'hypertexte et l'engin de recherche spécifique InQuery créé par la société Sovereign Hill Software.

La consultation de l'OPAC par le biais du traditionnel catalogue en ligne est cependant encore indispensable puisque plusieurs catalogues de livres et la plupart des catalogues de "non-livres" (microformes, articles, manuscrits, etc.) ne sont pas encore présents dans l'ESS. Le menu de recherche avancée précise les bases de données et les collections disponibles par rubrique, et la quantité de documents pour chaque rubrique.

Le 20 décembre 1998, l'ESS comprend les notices de 9,5 millions de livres, incluant les notices JACKPHY (notices en japonais, arabe, chinois, coréen, persan, hébreu et yiddish), 825.664 périodiques, 278.771 documents visuels tels que films, films fixes ou vidéos, 68.135 images et photos, 209.142 enregistrements sonores et partitions musicales, 171.756 cartes, 10.698 manuscrits et 6.318 logiciels. Les notices de 140.000 photos et manuscrits de la National Digital Library Program's American Memory sont reliées à plus de 70.000 photos et images numériques disponibles en ligne. Grâce à l'indexation des oeuvres sélectionnées et classées par l'Universal Library de l'Université Carnegie Mellon (Pittsburgh, Pennsylvanie, USA), l'ESS procure aussi les liens au texte intégral de 2.500 oeuvres en ligne disponibles sur différents sites.