WeRead Powered by ReaderPub
Les langues sur le web cover

Les langues sur le web

Chapter 2: TABLE
Open in WeRead

Explore more books like this:

About This Book

An accessible survey of how languages are represented and used on the internet, tracing technical foundations (ASCII, Unicode), mapping multilingual resources (online dictionaries, encyclopedias, projects) and discussing tools and practices for localization, computer-assisted and automatic translation, and language learning. The author examines the statistical predominance of English while highlighting efforts to support minority and regional languages, presents examples of multilingual initiatives and software solutions, and reflects on sociolinguistic notions of language communities and equitable access. Interviews and practical references illustrate persistent challenges and emerging approaches toward a more inclusive web.

The Project Gutenberg eBook of Les langues sur le web

This ebook is for the use of anyone anywhere in the United States and most other parts of the world at no cost and with almost no restrictions whatsoever. You may copy it, give it away or re-use it under the terms of the Project Gutenberg License included with this ebook or online at www.gutenberg.org. If you are not located in the United States, you will have to check the laws of the country where you are located before using this eBook.
*** This is a COPYRIGHTED Project Gutenberg eBook. Details Below. ***
*** Please follow the copyright guidelines in this file. ***

Title: Les langues sur le web

Author: Marie Lebert

Release date: April 19, 2010 [eBook #32065]

Language: French

Credits: Produced by Al Haines

*** START OF THE PROJECT GUTENBERG EBOOK LES LANGUES SUR LE WEB ***

Produced by Al Haines

LES LANGUES SUR LE WEB

MARIE LEBERT

NEF, Université de Toronto, 2010

Copyright © 2010 Marie Lebert. Tous droits réservés.

Ce livre est dédié à toutes les personnes interviewées de par le monde sur ce vaste sujet.

On dit souvent que l'internet abolit le temps, les distances et les frontières, mais qu'en est-il des langues? Comme l'écrit si bien Maria Victoria Marinetti, professeure d'espagnol en entreprise et traductrice, «il est très important de pouvoir communiquer en différentes langues. Je dirais même que c'est obligatoire, car l'information donnée sur l'internet est à destination du monde entier, alors pourquoi ne l'aurions-nous pas dans notre propre langue ou dans la langue que nous souhaitons utiliser? Information mondiale, mais pas de vaste choix dans les langues, ce serait contradictoire, pas vrai?» Tel est le sujet de ce livre. Il s'agit de la version revue et actualisée de L'internet et les langues, publié en 2009.

Marie Lebert, chercheuse et journaliste, s'intéresse aux technologies dans le monde des médias et des langues. Elle est l'auteure des livres suivants: Le livre, de l'imprimé au numérique (NEF, 2010), L'internet et les langues (NEF, 2009) et Le multilinguisme sur le web (NEF, 1999). Ses livres sont publiés par le NEF (Net des études françaises), Université de Toronto, et sont librement disponibles sur le site du NEF <www.etudes-francaises.net> et dans le Projet Gutenberg <www.gutenberg.org>, dans divers formats permettant leur lecture sur tout appareil électronique.

TABLE

Introduction

L'Ethnologue
  * Un catalogue exhaustif des langues
  * Une oeuvre de longue haleine
  * La codification des langues

De l'ASCII a l'Unicode
  * L'ASCII
  * L'Unicode
  * ASCII et/ou Unicode

Des «nations de langues»

Vers un web multilingue
  * Premiers pas
  * La Kotoba Home Page
  * OneLook Dictionaries
  * Autres expériences
  * L'affaire de tous

L'anglais reste prédominant
  * Une réalité statistique
  * Commentaires francophones
  * Des solutions logicielles

Le français sur le web
  * Une «nation de langue» francophone
  * Le patrimoine linguistique en ligne

Premiers projets multilingues
  * Travlang
  * Les projets de Tyler
  * NetGlos
  * Logos

Dictionnaires de langues
  * Dictionnaires imprimés en ligne
  * Répertoires de dictionnaires
  * yourDictionary.com
  * Le Grand dictionnaire terminologique
  * Eurodicautom et IATE
  * WordReference.com

L'apprentissage des langues
  * Quelques expériences
  * Des outils pour les enseignants
  * La LINGUIST List

Les langues minoritaires
  * La liste de Caoimhín
  * Le site Windows on Haiti

Des encyclopédies multilingues
  * Des projets précurseurs
  * Wikipédia

Localisation et internationalisation

La traduction assistée par ordinateur

La traduction automatique
  * Définition
  * Historique
  * Quelques avis
  * Un marché en 2000
  * L'UNL, métalangage numérique

Chronologie

Remerciements

INTRODUCTION

On dit souvent que l'internet abolit le temps, les distances et les frontières, mais qu'en est-il des langues?

# Des «nations de langues»

«Comme l'internet n'a pas de frontières nationales, les internautes s'organisent selon d'autres critères propres au médium. En termes de multilinguisme, vous avez des communautés virtuelles, par exemple ce que j'appelle les "nations de langues", tous ces internautes qu'on peut regrouper selon leur langue maternelle quel que soit leur lieu géographique. Ainsi la nation de la langue espagnole inclut non seulement les internautes d'Espagne et d'Amérique latine, mais aussi tous les Hispanophones vivant aux États-Unis, ou encore ceux qui parlent espagnol au Maroc.» (Randy Hobler, consultant en marketing internet chez Globalink, société de produits et services de traduction, septembre 1998)

# La «démocratie linguistique»

«Dans un rapport de l'UNESCO du début des années 1950, l'enseignement dispensé dans sa langue maternelle était considéré comme un droit fondamental de l'enfant. La possibilité de naviguer sur l'internet dans sa langue maternelle pourrait bien être son équivalent à l'Âge de l'Information. Si l'internet doit vraiment devenir le réseau mondial qu'on nous promet, tous les usagers devraient y avoir accès sans problème de langue. Considérer l'internet comme la chasse gardée de ceux qui, par accident historique, nécessité pratique ou privilège politique, connaissent l'anglais, est injuste à l'égard de ceux qui ne connaissent pas cette langue.» (Brian King, directeur du WorldWide Language Institute, septembre 1998)

# Un médium pour le monde

«Il est très important de pouvoir communiquer en différentes langues. Je dirais même que c'est obligatoire, car l'information donnée sur l'internet est à destination du monde entier, alors pourquoi ne l'aurions-nous pas dans notre propre langue ou dans la langue que nous souhaitons utiliser? Information mondiale, mais pas de vaste choix dans les langues, ce serait contradictoire, pas vrai?» (Maria Victoria Marinetti, professeure d'espagnol en entreprise et traductrice, août 1999)

# De bons logiciels…

«Quand la qualité des logiciels sera suffisante pour que les gens puissent converser par écrit et par oral sur le web en temps réel dans différentes langues, nous verrons tout un monde s'ouvrir à nous. Les scientifiques, les hommes politiques, les hommes d'affaires et bien d'autres groupes seront à même de communiquer immédiatement entre eux sans l'intermédiaire de médiateurs ou traducteurs.» (Tim McKenna, écrivain et philosophe, octobre 2000)

# …dans toutes les langues

«Les recherches sur la traduction automatique devraient permettre une traduction automatique dans les langues souhaitées, mais avec des applications pour toutes les langues et non les seules dominantes (ex.: diffusion de documents en japonais, si l'émetteur est de langue japonaise, et lecture en breton, si le récepteur est de langue bretonne). Il y a donc beaucoup de travaux à faire dans le domaine de la traduction automatique et écrite de toutes les langues.» (Pierre- Noël Favennec, expert à la direction scientifique de France Télécom R&D, février 2001)

# Des dictionnaires de langues en ligne

«J'ai débuté WordReference.com en 1999 pour procurer des dictionnaires bilingues gratuits en ligne et d'autres outils pour tous sur l'internet. Depuis, le site s'est progressivement développé pour devenir l'un des sites de dictionnaires en ligne les plus utilisés, et le principal dictionnaire en ligne pour les paires de langues anglais- espagnol, anglais-français, anglais-italien, espagnol-français et espagnol-portugais. Ce site est toujours classé sans interruption parmi les 500 sites les plus visités du web. Aujourd'hui, je suis heureux de continuer à améliorer ces dictionnaires, les autres outils linguistiques du site et les forums de langues. J'ai vraiment plaisir à créer de nouvelles fonctionnalités pour rendre ce site de plus en plus utile.» (Michael Kellogg, fondateur de WordReference.com, mars 2010)

***

Ce livre est issu des multiples liens tissés sur le Net des études françaises (NEF), fondé en mai 2000 par Russon Wooldridge, professeur à l'Université de Toronto (Canada). Sauf indication contraire, les citations sont des extraits des Entretiens du NEF <http://www.etudes- francaises.net/entretiens/> et des entretiens qui ont suivi pour les actualiser et les compléter.

L'ETHNOLOGUE

= Un catalogue exhaustif des langues

Le nombre de langues vivantes parlées sur notre planète s'élève très exactement à 6.909, un décompte datant de 2009. Ces langues vivantes sont toutes recensées dans L'Ethnologue: Languages of the World, catalogue exhaustif à la fois par la masse d'informations glanées et par la qualité de ces informations, vérifiées une à une sur le terrain dans le monde entier par un réseau composé de milliers de linguistes.

Travaillant au sein de l'organisme SIL International (SIL signifiant: Summer Institute of Linguistics), l'équipe de l'Ethnologue insiste à juste titre sur la minutie avec laquelle les informations sont collectées puis vérifiées. Une petite équipe de chercheurs basée à Dallas, dans le Texas, est elle-même relayée par des équipes nationales et linguistiques présentes sur tous les continents.

Barbara Grimes, directrice de publication entre 1971 et 2000 (8e-14e éditions), relate en janvier 2000 : « Il s'agit d'un catalogue des langues dans le monde, avec des informations sur les pays où elles sont parlées, une estimation du nombre de personnes qui les parlent, la famille linguistique à laquelle elles appartiennent, les autres termes utilisés pour ces langues, les noms de dialectes, diverses informations socio-linguistiques et démographiques, les dates des Bibles publiées, un index des noms de langues, un index des familles linguistiques et enfin des cartes géographiques pour les langues.»

L'index des noms de langues (Ethnologue Name Index) donne la liste des noms de langues et de dialectes ainsi que leurs synonymes, et l'index des familles linguistiques (Ethnologue Language Family Index) organise les langues selon leurs familles linguistiques.

Lors d'un entretien précédent, en août 1998, Barbara Grimes explique aussi que, si la version web est utile, la version imprimée l'est encore plus, en langue anglaise pour toucher un large public: «Nous avons eu des demandes nous demandant l'accès à l'Ethnologue dans plusieurs autres langues, mais nous n'avons pas le personnel ni les fonds pour la traduction ou l'actualisation, indispensable puisque notre site est constamment mis à jour. L'internet est (…) un moyen commode pour mettre notre documentation à la disposition d'une audience plus large que celle de l'Ethnologue imprimé. D'un autre côté, l'Ethnologue sur l'internet n'atteint en fait qu'une audience limitée disposant d'ordinateurs. Or, dans les personnes que nous souhaitons atteindre, nombreuses sont celles qui ne disposent pas d'ordinateurs. Je pense particulièrement aux habitants du dit "Tiers-monde".»

Une nouvelle édition de l'Ethnologue est publiée environ tous les quatre ans. L'édition la plus récente, la 16e, date de 2009, avec une version imprimée payante et une version web gratuite… comme d'habitude depuis que le web existe. Les éditions précédentes proposaient aussi une version CD-ROM payante, pendant quelques années, avant que l'internet à débit rapide ne devienne monnaie courante.

= Une oeuvre de longue haleine

Contrairement à ce que certains croient, cette vaste entreprise n'est née ni avec l'internet (1974) ni avec le web (1993), même si sa version web a beaucoup contribué à la faire connaître. Il s'agit d'un projet de recherche actif depuis plus de cinquante ans.

L'Ethnologue est fondé en 1951 par Richard Pittman, qui est le directeur de publication des sept premières éditions, de 1951 à 1969. À l'origine, son but est de partager les informations glanées sur les langues minoritaires avec ses collègues de SIL International et d'autres linguistes. L'Ethnologue débute comme un catalogue de langues minoritaires avant de prendre de l'ampleur au fil des ans.

Barbara Grimes est la directrice de publication des sept éditions suivantes, de la 8e à la 14e, entre 1971 à 2000. À partir de 1971, le champ des informations s'élargit pour ne plus concerner seulement les langues minoritaires, mais pour englober aussi peu à peu toutes les langues vivantes connues dans le monde. Entre 1967 et 1973, Barbara Grimes révise d'abord en profondeur toutes les informations disponibles sur les langues d'Afrique, des Amériques, du Pacifique et de quelques pays d'Asie. Pendant ses années comme directrice de publication, entre 1971 et 2000, le nombre de langues recensées passe de 4.493 à 6.809, et les informations disponibles pour chaque langue sont elles-mêmes plus complètes, si bien que l'encyclopédie triple de taille.

En 2000, Raymond Gordon Jr. devient le troisième directeur de publication de l'Ethnologue et produit la 15e édition (2005). Il cède ensuite la place à Paul Lewis, aidé de Conrad Hurd pour la gestion de la base de données et de Raymond Gordon pour la direction des équipes nationales et linguistiques sur le terrain.

Dans l'introduction de la 16e édition (2009), on peut lire ceci : «La manière dont chacun choisit de définir une langue dépend des motifs qu'on a d'identifier cette langue comme étant distincte d'une autre. Certains basent la définition d'une langue sur des raisons purement linguistiques. D'autres reconnaissent la nécessité de prendre également en compte des facteurs sociaux, culturels ou politiques. En outre, les locuteurs d'une langue donnée ont souvent leurs propres critères sur l'appropriation d'une langue comme étant la leur. Ces critères sont souvent bien davantage liés à des questions de patrimoine et d'identité qu'aux traits linguistiques de la langue ou des langues en question.»

= La codification des langues

Comme expliqué dans l'introduction de la 16e édition (2009), une caractéristique de la base de données de l'Ethnologue est un système de codification des langues au moyen de trois lettres (par exemple FRA pour la France), ce depuis sa création. Cette codification est incluse dans l'encyclopédie elle-même à partir de la 10e édition (1984).

L'Organisation internationale de normalisation (ISO) adopte pour sa part la norme ISO 639-2 en 1998. Cette norme, qui codifie également chaque langue au moyen de trois lettres, est une convergence de la norme ISO 639-1 (un ancien standard de deux lettres pour chaque langue, adopté en 1988) et de la norme ANSI Z39.53 (les codes de langues MARC, trois lettres pour chaque langue, développés par les bibliothèques américaines et adoptés en tant que norme nationale en 1987).

La norme ISO 639-2 (1998) devient vite insuffisante puisqu'elle codifie moins de 400 langues individuelles. En 2002, l'ISO invite donc SIL International à établir une nouvelle norme permettant d'harmoniser les codes utilisés dans l'Ethnologue avec les codes de la norme ISO, en y intégrant aussi les codes des langues mortes utilisés par la Linguist List, une grande liste de diffusion à destination des linguistes.

Le résultat, officiellement approuvé en 2006 et publié en 2007, est la nouvelle norme ISO 639-3, qui attribue un code de trois lettres à près de 7.500 langues. SIL International est également désigné comme l'organisme responsable de l'enregistrement de nouvelles langues pour l'ISO 639-3, et gère donc le cycle annuel des modifications et des mises à jour sur une page de son propre site.

DE L'ASCII À L'UNICODE

= L'ASCII

Communiquer dans plusieurs langues implique d'avoir des systèmes d'encodage adaptés à nos alphabets ou idéogrammes respectifs.

Le premier système d'encodage informatique est l'ASCII (American standard code for information interchange). Publié en 1968 aux États- Unis par l'American National Standards Institute (ANSI), avec actualisation en 1977 et 1986, l'ASCII est un code standard de 128 caractères traduits en langage binaire sur sept bits (A est traduit par «1000001», B est traduit par «1000010», etc.). Les 128 caractères comprennent 33 caractères de contrôle (qui ne représentent donc pas de symbole écrit) et 95 caractères imprimables: les 26 lettres sans accent en majuscules (A-Z) et minuscules (a-z), les chiffres, les signes de ponctuation et quelques caractères spéciaux, le tout correspondant aux touches du clavier anglophone.

L'ASCII permet uniquement la lecture de l'anglais et du latin. Il ne permet pas de prendre en compte les lettres accentuées présentes dans bon nombre de langues européennes, et à plus forte raison les langues non alphabétiques (chinois, japonais, coréen, etc.). Ceci ne pose pas de problème majeur les premières années, tant que l'échange de fichiers électroniques se limite essentiellement à l'Amérique du Nord. Mais le multilinguisme devient bientôt une nécessité vitale. Des variantes de l'ASCII (norme ISO-8859 ou ISO-Latin) prennent en compte les caractères accentués de quelques langues européennes. La variante pour le français, par exemple, est définie par la norme ISO-8859-1 (ISO-Latin- 1).

= L'Unicode

Avec le développement du web, l'échange des données s'internationalise de plus en plus. On ne peut plus se limiter à l'utilisation de l'anglais et de quelques langues européennes, traduites par un système d'encodage datant de 1968. De plus, le passage de l'ASCII original à ses différentes extensions devient vite un véritable casse-tête, y compris au sein de l'Union européenne, les problèmes étant entre autres la multiplication des variantes, la corruption des données dans les échanges informatiques ou encore l'incompatibilité des systèmes, les pages ne pouvant être affichées que dans une seule langue à la fois.

Olivier Gainon, fondateur de CyLibris et pionnier de l'édition électronique littéraire, écrit en décembre 2000: «Il faut que le réseau respecte les lettres accentuées, les lettres spécifiques, etc. Je crois très important que les futurs protocoles permettent une transmission parfaite de ces aspects - ce qui n'est pas forcément simple (dans les futures évolutions de l'HTML ou des protocoles IP, etc.). Donc il faut que chacun puisse se sentir à l'aise avec l'internet et que ce ne soit pas simplement réservé à des (plus ou moins) anglophones. Il est anormal aujourd'hui que la transmission d'accents puisse poser problème dans les courriers électroniques. La première démarche me semble donc une démarche technique. Si on arrive à faire cela, le reste en découle: la représentation des langues se fera en fonction du nombre de connectés, et il faudra envisager à terme des moteurs de recherche multilingues.»

Publié pour la première fois en janvier 1991, l'Unicode est un système d'encodage universel sur 16 bits spécifiant un nombre unique pour chaque caractère. Ce nombre est lisible quels que soient la plateforme, le logiciel et la langue utilisés. L'Unicode peut traiter 65.000 caractères uniques et prendre en compte tous les systèmes d'écriture de la planète. A la grande satisfaction des linguistes, il remplace progressivement l'ASCII, avec des variantes UTF-8, UTF-16 et UTF-32 (UTF: Unicode transformation format) en fonction du nombre de bits utilisés. Il devient une composante des spécifications du World Wide Web Consortium (W3C), l'organisme international chargé du développement du web.

L'utilisation de l'Unicode se généralise à partir de 1998, par exemple pour les fichiers texte sous plateforme Windows (Windows NT, Windows 2000, Windows XP et versions suivantes), qui étaient jusque-là en ASCII.

Mais l'Unicode ne peut résoudre tous les problèmes, comme le souligne en juin 2000 Luc Dall'Armellina, co-auteur et webmestre d'oVosite, un espace d'écriture hypermédia: «Les systèmes d'exploitation se dotent peu à peu des kits de langues et bientôt peut-être de polices de caractères Unicode à même de représenter toutes les langues du monde; reste que chaque application, du traitement de texte au navigateur web, emboîte ce pas. Les difficultés sont immenses: notre clavier avec ses ± 250 touches avoue ses manques dès lors qu'il faille saisir des Katakana ou Hiragana japonais, pire encore avec la langue chinoise. La grande variété des systèmes d'écriture de par le monde et le nombre de leurs signes font barrage. Mais les écueils culturels ne sont pas moins importants, liés aux codes et modalités de représentation propres à chaque culture ou ethnie.»

Patrick Rebollar, professeur de littérature française au Japon et modérateur de la liste de diffusion LITOR (littérature et ordinateur), donne son sentiment en janvier 2000: «Il s'agit d'abord d'un problème logiciel. Comme on le voit avec Netscape ou Internet Explorer, la possibilité d'affichage multilingue existe. La compatibilité entre ces logiciels et les autres (de la suite Office de Microsoft, par exemple) n'est cependant pas acquise. L'adoption de la table Unicode devrait résoudre une grande partie des problèmes, mais il faut pour cela réécrire la plupart des logiciels, ce à quoi les producteurs de logiciels rechignent du fait de la dépense, pour une rentabilité qui n'est pas évidente car ces logiciels entièrement multilingues intéressent moins de clients que les logiciels de navigation.»

= ASCII et/ou Unicode

Le Projet Gutenberg est fondé dès 1971 par Michael Hart pour numériser les oeuvres littéraires et les mettre gratuitement à la disposition de tous.

Les oeuvres sont numérisées en mode texte, en utilisant l'ASCII original sur sept bits ou, pour les langues avec accents, l'ASCII sur huit bits pour une prise en compte des caractères accentués. Mais, même dans ce cas, le Projet Gutenberg propose systématiquement en complément une version ASCII sur sept bits sans accents. Sauf, bien entendu, dans le cas de langues non encodables en ASCII, comme le chinois, qui est encodé au format Big-5 pour le chinois traditionnel.

Surnommé à juste raison «le plus petit dénominateur commun», l'ASCII sur sept bits est le seul format compatible avec 99% des machines et des logiciels, et pouvant être converti dans de nombreux autres formats. Il sera toujours utilisé quand d'autres formats auront disparu. Il est l'assurance que les collections ne deviendront jamais obsolètes, et survivront aux changements technologiques des prochaines décennies ou même des prochains siècles. Il n'existe pas d'autre standard aussi largement utilisé, y compris l'Unicode, système d'encodage universel créé en 1991. Ce jusqu'en 2008, date à laquelle les deux systèmes d'encodage sont également représentés sur le web.

Le Projet Gutenberg propose certains livres dans d'autres formats que l'ASCII, notamment dans les trois formats répandus que sont les formats HTML, XML et RTF. Des fichiers Unicode sont également présents et remplacent peu à peu les fichiers ASCII sur huit bits pour les langues avec accents comme le français. De plus, tout format proposé par tel ou tel volontaire est généralement accepté (PDF, LIT, TeX et beaucoup d'autres), dans la mesure où un fichier ASCII est également présent.

Les collections du Projet Gutenberg sont d'abord essentiellement anglophones, puisque ce projet est basé aux États-Unis et qu'il sert en priorité la communauté anglophone nationale et internationale. En octobre 1997, Michael Hart annonce son intention d'intensifier la production de livres dans des langues autres que l'anglais. Début 1998, le catalogue comprend quelques oeuvres en allemand, en espagnol, en français (dix titres), en italien et en latin. En juillet 1999, Michael écrit: «J'introduis une nouvelle langue par mois maintenant, et je vais poursuivre cette politique aussi longtemps que possible.»

Le multilinguisme devient ensuite l'une des priorités du Projet Gutenberg, tout comme l'internationalisation, avec le Project Gutenberg Australia (créé en août 2001), le Projet Gutenberg Europe (créé en janvier 2004), le Project Gutenberg Canada (créé en juillet 2007), et d'autres Projets Gutenberg à venir dans divers pays, notamment au Portugal.

Dans le Projet Gutenberg original, 25 langues sont représentées en janvier 2004, 42 langues en juillet 2005, dont le sanscrit et les langues mayas, et 50 langues en décembre 2006. À cette date, les langues principales sont l'anglais, le français, l'allemand, le finnois, le hollandais, l'espagnol, l'italien, le chinois, le portugais et le tagalog.

Dès ses débuts en janvier 2004, le Projet Gutenberg Europe propose un site multilingue pour gérer la relecture partagée entre les volontaires, afin de prendre en compte les principales langues nationales. En avril 2004, grâce à des traducteurs volontaires, le site est disponible en douze langues. L'objectif à moyen terme est un site en soixante langues, et donc soixante équipes linguistiques, avec prise en compte de toutes les langues européennes. Le Projet Gutenberg Europe utilise l'Unicode et non l'ASCII, pour pouvoir traiter des livres dans un grand nombre de langues.

DES «NATIONS DE LANGUES»

Consultant en marketing internet chez Globalink, une société de produits et services de traduction, Randy Hobler écrit en septembre 1998: «Comme l'internet n'a pas de frontières nationales, les internautes s'organisent selon d'autres critères propres au médium. En termes de multilinguisme, vous avez des communautés virtuelles, par exemple ce que j'appelle les "nations de langues", tous ces internautes qu'on peut regrouper selon leur langue maternelle quel que soit leur lieu géographique. Ainsi la nation de la langue espagnole inclut non seulement les internautes d'Espagne et d'Amérique latine, mais aussi tous les Hispanophones vivant aux États-Unis, ou encore ceux qui parlent espagnol au Maroc.»

Si Randy donne l'exemple d'une «nation de langue» hispanophone répartie sur trois continents, la même remarque vaut pour la Francophonie, une communauté de langue française présente sur cinq continents, ou encore la Créolophonie, puisque le créole est parlé non seulement dans les Caraïbes mais aussi à Paris, Montréal et New York.

À ses débuts, l'internet est anglophone à pratiquement 100%, ce qui s'explique par le fait qu'il débute aux États-Unis en tant que réseau reliant les agences gouvernementales et les universités, suite à la création du protocole TCP/IP en 1974 par Vinton Cerf et Robert Kahn. Après la création du World Wide Web en 1990 par Tim Berners-Lee au Centre européen pour la recherche nucléaire (CERN) à Genève (Suisse) et le lancement en novembre 1993 du premier navigateur Mosaic, ancêtre de Netscape, l'internet se développe rapidement, d'abord aux États-Unis grâce aux investissements considérables du gouvernement, puis au Canada, puis dans le monde entier.

Après avoir été anglophone à pratiquement 100%, l'internet est encore anglophone à plus de 80% en 1998, un pourcentage qui s'explique par trois facteurs: (a) la création d'un grand nombre de sites web émanant des États-Unis, du Canada et du Royaume-Uni; (b) une proportion d'usagers particulièrement forte en Amérique du Nord par rapport au reste du monde, les ordinateurs étant bien meilleur marché qu'ailleurs, tout comme la connexion à l'internet sous forme de forfait mensuel à prix modique; (c) l'usage de l'anglais en tant que principale langue d'échange internationale.

Dans plusieurs pays d'Europe, par exemple, cette connexion est d'abord tarifée à la durée, avec un tarif de jour et un tarif de nuit moins élevé. Les usagers passent donc beaucoup moins de temps sur l'internet qu'ils ne le souhaiteraient, et choisissent souvent de surfer la nuit pour éviter les factures trop élevées. Fin 1998 et début 1999, des mouvements de grève sont lancés en France, en Italie et en Allemagne pour faire pression sur les sociétés prestataires afin qu'elles baissent leurs prix et qu'elles proposent des forfaits internet, avec gain de cause dans les mois qui suivent.

En 1997, Babel, initiative conjointe d'Alis Technologies et de l'Internet Society, mène la première étude sur la répartition des langues sur l'internet. Datée de juin 1997, le Palmarès des langues de la toile donne les pourcentages de 82,3% pour l'anglais, 4% pour l'allemand, 1,6% pour le japonais, 1,5% pour le français, 1,1% pour l'espagnol, 1,1% pour le suédois et 1% pour l'italien.

Dans un article publié le 21 juillet 1998 par ZDNN (ZDNetwork News), Martha Stone, journaliste, précise: «Cette année, le nombre de nouveaux sites non anglophones va probablement dépasser celui de nouveaux sites anglophones, et le monde cyber est en train de véritablement devenir une toile à l'échelle mondiale. (…) Selon Global Reach [une société promouvant la localisation des sites web], les groupes linguistiques se développant le plus vite sont les groupes non anglophones: on note une progression de 22,4% pour les sites web hispanophones, 12,3% pour les sites nippons, 14% pour les sites germanophones et 10% pour les sites francophones. On estime à 55,7 millions le nombre de personnes non anglophones ayant accès au web. (…) Alors que 6% seulement de la population mondiale est de langue maternelle anglaise (et 16% de langue maternelle espagnole), 80% des pages web sont en anglais.» Toujours selon Global Reach, 15% seulement des 500 millions d'habitants que compte l'Europe sont de langue maternelle anglaise, 28% maîtrisent bien l'anglais, et 32% consultent le web anglophone.

Le concept de «démocratie linguistique» est développé par Brian King, directeur du WorldWide Language Institute (WWLI), dans un entretien daté de septembre 1998: «Dans un rapport de l'UNESCO du début des années 1950, l'enseignement dispensé dans sa langue maternelle était considéré comme un droit fondamental de l'enfant. La possibilité de naviguer sur l'internet dans sa langue maternelle pourrait bien être son équivalent à l'Âge de l'Information. Si l'internet doit vraiment devenir le réseau mondial qu'on nous promet, tous les usagers devraient y avoir accès sans problème de langue. Considérer l'internet comme la chasse gardée de ceux qui, par accident historique, nécessité pratique ou privilège politique, connaissent l'anglais, est injuste à l'égard de ceux qui ne connaissent pas cette langue.»

Jean-Pierre Cloutier est l'auteur des Chroniques de Cybérie, une lettre d'information électronique sur l'actualité de l'internet. Il écrit en août 1999: «Cet été, le cap a été franchi. Plus de 50% des utilisateurs et utilisatrices du réseau sont hors des États-Unis. L'an prochain, plus de 50% des utilisateurs seront non anglophones. Il y a seulement cinq ans, c'était 5%. Formidable, non?»

Les usagers non anglophones atteignent en effet la barre des 50% au cours de l'été 2000. Selon Global Reach, ce pourcentage est de 52,5% en été 2001, 57% en décembre 2001, 59,8% en avril 2002, 64,4% en septembre 2003 (dont 34,9% d'Européens non anglophones et 29,4% d'Asiatiques) et 64,2% en mars 2004 (dont 37,9% d'Européens non anglophones et 33% d'Asiatiques).

De plus, nombre de communautés pratiquent le bilinguisme au quotidien, par exemple à Genève pour le français et l'allemand ou San Francisco pour l'anglais et l'espagnol, avec l'exigence de proposer toutes les informations en deux langues, le cas extrême étant la Communauté européenne avec ses 11 langues officielles en 2003, puis ses 24 langues officielles en 2007 après son élargissement progressif vers l'Europe de l'Est.

VERS UN WEB MULTILINGUE

= Premiers pas

Professeure d'espagnol en entreprise et traductrice, Maria Victoria Marinetti écrit en août 1999: «Il est très important de pouvoir communiquer en différentes langues. Je dirais même que c'est obligatoire, car l'information donnée sur l'internet est à destination du monde entier, alors pourquoi ne l'aurions-nous pas dans notre propre langue ou dans la langue que nous souhaitons utiliser? Information mondiale, mais pas de vaste choix dans les langues, ce serait contradictoire, pas vrai?»

Yahoo! est précurseur dans ce domaine. En Californie, deux étudiants de l'Université de Stanford, Jerry Lang et David Filo, lancent en janvier 1994 l'annuaire Yahoo! pour recenser les sites web et les classer par thèmes. L'annuaire est un succès, avec un classement plus pointu que celui de moteurs de recherche comme AltaVista, où ces tâches sont entièrement automatisées. Mais, si une recherche ne donne pas de résultat dans Yahoo!, elle est automatiquement aiguillée vers AltaVista, et réciproquement.

Trois ans plus tard, Yahoo! propose un classement en 63 grandes catégories thématiques, tout comme une interface en plusieurs langues: anglais, allemand, coréen, français, japonais, norvégien et suédois.

En décembre 1997, AltaVista est le premier moteur de recherche à lancer un service gratuit de traduction automatisée de l'anglais vers cinq autres langues (allemand, espagnol, français, italien et portugais) et vice versa, la page originale et la traduction apparaissant en vis-à- vis à l'écran. AltaVista Translation, surnommé aussi Babel Fish, est l'oeuvre de SYSTRAN, une société franco-américaine pionnière dans le traitement automatique des langues. Babel Fish est alimenté par des dictionnaires multilingues comprenant 2,5 millions de termes.

Bien qu'ayant ses limites, avec une traduction de trois pages maximum et un texte traduit très approximatif, ce service est immédiatement très apprécié des douze millions d'usagers que compte l'internet de l'époque, dont un nombre croissant d'usagers non anglophones. Babel Fish ouvre aussi la voie à d'autres services du même genre - développés entre autres par Alis Technologies, Lernout & Hauspie, Globalink ou Softissimo - et contribue grandement au plurilinguisme du web.

= La Kotoba Home Page

Yoshi Mikami, informaticien à Tokyo (Japon), lance en décembre 1995 le site bilingue anglais-japonais The Languages of the World by Computers and the Internet, plus connu sous le nom de Logos Home Page ou Kotoba Home Page. Le site donne un bref historique de chaque langue, ses caractéristiques, son système d'écriture, son jeu de caractères et enfin la configuration du clavier dans la langue donnée. Yoshi Mikami est également co-auteur (avec Kenji Sekine et Nobutoshi Kohara) de Pour un web multilingue, publié en août 1997 en japonais par les éditions O'Reilly avant d'être traduit en anglais, en allemand et en français (version française parue en septembre 1998).

Yoshi écrit en décembre 1998: «Ma langue maternelle est le japonais. Comme j'ai suivi mes études de troisième cycle aux États-Unis et que j'ai travaillé dans l'informatique, je suis devenu bilingue japonais/anglais américain. J'ai toujours été intéressé par différentes langues et cultures, aussi j'ai appris le russe, le français et le chinois dans la foulée. A la fin de 1995, j'ai créé sur le web The Languages of the World by Computers and the Internet et j'ai tenté de donner - en anglais et en japonais - un bref historique de toutes ces langues, ainsi que les caractéristiques propres à chaque langue et à sa phonétique. Suite à l'expérience acquise, j'ai invité mes deux associés à écrire un livre sur la conception, la création et la présentation de pages web multilingues, livre qui fut publié en août 1997 dans son édition japonaise, le premier livre au monde sur un tel sujet.»

Comment voit-il l'évolution vers un web multilingue? «Il y a des milliers d'années de cela, en Égypte, en Chine et ailleurs, les gens étaient plus sensibles au fait de communiquer leurs lois et leurs réflexions non seulement dans une langue mais dans plusieurs. Dans notre monde moderne, chaque État a le plus souvent adopté une seule langue de communication. A mon avis, l'internet verra l'utilisation plus grande de langues différentes et de pages multilingues - et pas seulement une gravitation autour de l'anglais américain - et un usage plus créatif de la traduction informatique multilingue. 99% des sites web créés au Japon sont en japonais!»

= OneLook Dictionaries

Robert Ware, enseignant, lance en avril 1996 le site OneLook Dictionaries pour permettre une recherche rapide dans des centaines de dictionnaires couvrant divers domaines: affaires, informatique et internet, médecine, religion, sciences et techniques, sports, généralités et argot.

Il explique en septembre 1998: «À titre personnel, je suis presque uniquement en contact avec des gens qui ne pratiquent qu'une langue et qui n'ont pas beaucoup de motivation pour développer leurs aptitudes linguistiques. Être en contact avec le monde entier change cette approche des choses. Et la change en mieux! (…) J'ai été long à inclure des dictionnaires non anglophones (en partie parce que je suis monolingue). Mais vous en trouverez maintenant quelques-uns.»

OneLook Dictionaries compte 2 millions de termes provenant de 425 dictionnaires en 1998, 2,5 millions de termes provenant de 530 dictionnaires en 2000, et 5 millions de termes provenant de 910 dictionnaires en 2003.

Robert Ware raconte aussi dans le même entretien: «Un fait intéressant s'est produit par le passé qui a été très instructif pour moi. En 1994, je travaillais pour un établissement scolaire et j'essayais d'installer un logiciel sur un modèle d'ordinateur particulier. J'ai trouvé une personne qui était en train de travailler sur le même problème, et nous avons commencé à échanger des courriels. Soudain, cela m'a frappé… Le logiciel avait été écrit à 40 kilomètres de là, mais c'était une personne située à l'autre bout du monde qui m'aidait. Les distances et l'éloignement géographique n'importaient plus! Et bien, ceci est formidable, mais à quoi cela nous mène-t-il? Je ne puis communiquer qu'en anglais mais, heureusement, mon correspondant pouvait utiliser aussi bien l'anglais que l'allemand qui était sa langue maternelle. L'internet a supprimé une barrière, celle de la distance, mais il subsiste la barrière de la langue, bien réelle.

Il semble que l'internet propulse simultanément les gens dans deux directions différentes. L'internet, anglophone à l'origine, relie les gens dans le monde entier. Par là même, il favorise une langue commune pour communiquer. Mais il suscite aussi des contacts entre des personnes de langue différente et permet ainsi de développer un intérêt plus grand pour le multilinguisme. Si une langue commune est appréciable, elle ne remplace en aucun cas la nécessité de plusieurs langues. L'internet favorise ainsi à la fois une langue commune et le multilinguisme, et ceci est un facteur qui aide à trouver des solutions. L'intérêt croissant pour les langues et le besoin qu'on en a stimulent de par le monde la création de cours de langues et d'instruments d'aide linguistique, et l'internet fournit la possibilité de les rendre disponibles rapidement et à bon marché.»

= Autres expériences

Même si l'anglais est encore prédominant à la fin des années 1990, les sites bilingues ou plurilingues sont de plus en plus nombreux, ce pour des raisons aussi bien commerciales que culturelles, qui prennent en compte le fait que tout le monde ne comprend pas l'anglais.

Brian King, directeur du WorldWide Language Institute (WWLI), écrit en septembre 1998: «De même que l'utilisateur non anglophone peut maintenant avoir accès aux nouvelles technologies dans sa propre langue, l'impact du commerce électronique peut constituer une force majeure qui fasse du multilinguisme la voie la plus naturelle vers le cyberespace. Les vendeurs de produits et services dans le marché virtuel mondial que devient l'internet doivent être préparés à desservir un monde virtuel qui soit aussi multilingue que le monde physique. S'ils veulent réussir, ils doivent s'assurer qu'ils parlent bien la langue de leurs clients!»

Le réseau ELSNET (European Network in Language and Speech) regroupe une centaine de partenaires académiques et commerciaux, l'objectif étant de mettre sur pied des systèmes multilingues pour la langue parlée et la langue écrite.

Steven Krauwer, coordinateur d'ELSNET, explique en septembre 1998: «En tant que citoyen européen, je pense que le multilinguisme sur le web est absolument essentiel. À mon avis, ce n'est pas une situation saine à long terme que seuls ceux qui ont une bonne maîtrise de l'anglais puissent pleinement exploiter les bénéfices du web. En tant que chercheur (spécialisé dans la traduction automatique), je vois le multilinguisme comme un défi majeur: pouvoir garantir que l'information sur le web soit accessible à tous, indépendamment des différences de langue. (…) Je compte passer le reste de ma vie professionnelle à utiliser les technologies de l'information pour supprimer ou au moins réduire la barrière des langues.»

Il ajoute en août 1999: «Je suis de plus en plus convaincu que nous devons veiller à ne pas aborder le problème du multilinguisme en l'isolant du reste. Je reviens de France, où j'ai passé de très bonnes vacances d'été. Même si ma connaissance du français est sommaire (c'est le moins que l'on puisse dire), il est surprenant de voir que je peux malgré tout communiquer sans problème en combinant ce français sommaire avec des gestes, des expressions du visage, des indices visuels, des schémas, etc. Je pense que le web (contrairement au système vieillot du courriel textuel) peut permettre de combiner avec succès la transmission des informations par différents canaux (ou différents moyens), même si ce processus n'est que partiellement satisfaisant pour chacun des canaux pris isolément.»

Pour un véritable multilinguisme sur le web, Steven Krauwer suggère plusieurs solutions pratiques: «(a) en ce qui concerne les auteurs: une meilleure formation des auteurs de sites web pour exploiter les combinaisons possibles permettant d'améliorer la communication en surmontant la barrière de la langue (et pas seulement par un vernis superficiel); (b) en ce qui concerne les usagers: des logiciels de traduction de type AltaVista Translation, dont la qualité n'est pas frappante, mais qui a le mérite d'exister; (c) en ce qui concerne les logiciels de navigation: des logiciels de traduction intégrée, particulièrement pour les langues non dominantes, et des dictionnaires intégrés plus rapides à consulter.»

= L'affaire de tous

Le multilinguisme est l'affaire de tous, témoin cet Appel du Comité européen pour le respect des cultures et des langues en Europe (CERCLE) qui, diffusé en 1998 dans les onze langues officielles de l'Union européenne (allemand, anglais, danois, espagnol, finlandais, français, grec, hollandais, italien, portugais et suédois), défend «une Europe humaniste, plurilingue et riche de sa diversité culturelle». Le CERCLE propose aux réviseurs du Traité de l'Union européenne douze amendements prenant en compte le respect des cultures et des langues.

On lit dans cet Appel que «la diversité et le pluralisme linguistiques ne sont pas un obstacle à la circulation des hommes, des idées et des marchandises ou services, comme veulent le faire croire certains, alliés objectifs, conscients ou non, de la culture et de la langue dominantes. C'est l'uniformisation et l'hégémonie qui sont un obstacle au libre épanouissement des individus, des sociétés et de l'économie de l'immatériel, source principale des emplois de demain. Le respect des langues, à l'inverse, est la dernière chance pour l'Europe de se rapprocher des citoyens, objectif toujours affiché, presque jamais mis en pratique. L'Union doit donc renoncer à privilégier la langue d'un seul groupe.»

Bruno Didier, webmestre de la bibliothèque de l'Institut Pasteur, écrit en août 1999: «L'internet n'est une propriété ni nationale, ni linguistique. C'est un vecteur de culture, et le premier support de la culture, c'est la langue. Plus il y a de langues représentées dans leur diversité, plus il y aura de cultures sur l'internet. Je ne pense pas qu'il faille justement céder à la tentation systématique de traduire ses pages dans une langue plus ou moins universelle. Les échanges culturels passent par la volonté de se mettre à la portée de celui vers qui on souhaite aller. Et cet effort passe par l'appréhension de sa langue. Bien entendu c'est très utopique comme propos. Concrètement, lorsque je fais de la veille, je peste dès que je rencontre des sites norvégiens ou brésiliens sans un minimum d'anglais.»

En 2000, le web est multilingue, mais la barrière de la langue est loin d'avoir disparu. Si toutes les langues sont désormais représentées sur le web, on oublie trop souvent que de nombreux usagers sont unilingues, et que même les polyglottes ne peuvent connaître toutes les langues. Il importe aussi d'avoir à l'esprit l'ensemble des langues, et pas seulement les langues dominantes. Il reste à créer des passerelles entre les communautés linguistiques pour favoriser la circulation des écrits dans d'autres langues, notamment en améliorant la qualité des logiciels de traduction.

L'ANGLAIS RESTE PRÉDOMINANT

= Une réalité statistique

L'anglais reste prépondérant et ceci n'est pas près de disparaître. Comme indiqué en janvier 1999 par Marcel Grangier, responsable de la section française des services linguistiques centraux de l'Administration fédérale suisse, «cette suprématie n'est pas un mal en soi, dans la mesure où elle résulte de réalités essentiellement statistiques (plus de PC par habitant, plus de locuteurs de cette langue, etc.). La riposte n'est pas de "lutter contre l'anglais" et encore moins de s'en tenir à des jérémiades, mais de multiplier les sites en d'autres langues. Notons qu'en qualité de service de traduction, nous préconisons également le multilinguisme des sites eux- mêmes. La multiplication des langues présentes sur l'internet est inévitable, et ne peut que bénéficier aux échanges multiculturels.»

Professeur en technologies de la communication à la Webster University de Genève (Suisse), Henk Slettenhaar insiste tout autant sur la nécessité de sites bilingues, dans la langue originale et en anglais. «Les communautés locales présentes sur le web devraient en tout premier lieu utiliser leur langue pour diffuser des informations, écrit-il en décembre 1998. Si elles veulent présenter ces informations à la communauté mondiale, celles-ci doivent être disponibles aussi en anglais. Je pense qu'il existe un réel besoin de sites bilingues. (…) Mais je suis enchanté qu'il existe maintenant tant de documents disponibles dans leur langue originale. Je préfère de beaucoup lire l'original avec difficulté plutôt qu'une traduction médiocre.»

Henk ajoute en août 1999: «A mon avis, il existe deux types de recherches sur le web. La première est la recherche globale dans le domaine des affaires et de l'information. Pour cela, la langue est d'abord l'anglais, avec des versions locales si nécessaire. La seconde, ce sont les informations locales de tous ordres dans les endroits les plus reculés. Si l'information est à destination d'une ethnie ou d'un groupe linguistique, elle doit d'abord être disponible dans la langue de l'ethnie ou du groupe, avec peut-être un résumé en anglais.»

Guy Antoine, créateur de Windows on Haiti, un site de référence sur la culture haïtienne, croit en la nécessité de l'anglais en tant que langue commune. «Pour des raisons pratiques, l'anglais continuera de dominer le web, relate-t-il en novembre 1999. Je ne pense pas que ce soit une mauvaise chose, en dépit des sentiments régionalistes qui s'y opposent, parce que nous avons besoin d'une langue commune permettant de favoriser les communications à l'échelon international. Ceci dit, je ne partage pas l'idée pessimiste selon laquelle les autres langues n'ont plus qu'à se soumettre à la langue dominante. Au contraire. Tout d'abord l'internet peut héberger des informations utiles sur les langues minoritaires, qui seraient autrement amenées à disparaître sans laisser de traces. De plus, à mon avis, l'internet incite les gens à apprendre les langues associées aux cultures qui les intéressent. Ces personnes réalisent rapidement que la langue d'un peuple est un élément fondamental de sa culture. De ce fait, je n'ai pas grande confiance dans les outils de traduction automatique qui, s'ils traduisent les mots et les expressions, ne peuvent guère traduire l'âme d'un peuple. Que sont les Haïtiens, par exemple, sans le kreyòl (créole pour les non initiés), une langue qui a permis de souder entre elles diverses tribus africaines transplantées à Haïti pendant la période de l'esclavage? Cette langue représente de manière la plus palpable l'unité de notre peuple. Elle est toutefois principalement une langue parlée et non écrite. A mon avis, le web va changer cet état de fait plus qu'aucun autre moyen traditionnel de diffusion d'une langue. Dans Windows on Haiti, la langue principale est l'anglais, mais on y trouve tout aussi bien un forum de discussion animé conduit en kreyòl. On y trouve également des documents sur Haïti en français et dans l'ancien créole colonial, et je suis prêt à publier d'autres documents en espagnol et dans diverses langues. Je ne propose pas de traductions, mais le multilinguisme est effectif sur ce site, et je pense qu'il deviendra de plus en plus la norme sur le web.»

Geoffrey Kingscott est directeur général de Praetorius, une société britannique spécialisée en linguistique appliquée. Il explique en septembre 1998: «Les caractéristiques propres au web sont la multiplicité de générateurs de sites et le bas prix de l'émission de messages. Ceci favorisera donc le multilinguisme au fur et à mesure du développement du web. Comme celui-ci a vu le jour aux États-Unis, il est encore principalement en anglais, mais ce n'est qu'un phénomène temporaire. Pour expliquer ceci plus en détail, je dirais que, quand nous comptions sur l'imprimé ou l'audiovisuel (film, télévision, radio, vidéo, cassettes), l'information ou le divertissement que nous attendions dépendait d'agents (éditeurs, stations de télévision ou de radio, producteurs de cassettes ou de vidéos) qui devaient subsister commercialement et, dans le cas de la radio-télédiffusion du service public, avec de sévères contraintes budgétaires. Ceci signifie que la quantité de clients est primordiale, et détermine la nécessité de langues autres que l'omniprésent anglais. Ces contraintes disparaissent avec le web.

Pour ne donner qu'un exemple mineur tiré de notre expérience, nous publions la version imprimée de notre magazine Language Today uniquement en anglais, qui est le dénominateur commun de nos lecteurs. Quand nous utilisons un article qui était originellement dans une autre langue que l'anglais, ou que nous relatons un entretien mené dans une autre langue que l'anglais, nous le traduisons en anglais et nous ne publions que la version anglaise, pour la raison suivante: le nombre de pages que nous pouvons imprimer est limité, et déterminé en fonction de notre clientèle (annonceurs et abonnés). Par contre, dans notre version web, nous proposons aussi la version originale.»

= Commentaires francophones

Luc dall'Armellina, co-auteur et webmestre d'oVosite, un espace d'écriture hypermédia, écrit en juin 2000: «L'anglais s'impose sans doute parce qu'il est devenu la langue commerciale d'échange généralisée; il semble important que toutes les langues puissent continuer à être représentées parce que chacune d'elle est porteuse d'une vision "singulière" du monde. La traduction simultanée (proposée par AltaVista par exemple) ou les versions multilingues d'un même contenu me semblent aujourd'hui les meilleures réponses au danger de pensée unique que représenterait une seule langue d'échange. Peut-être appartient-il aux éditeurs des systèmes d'exploitation (ou de navigateurs?) de proposer des solutions de traduction partielle, avec toutes les limites connues des systèmes automatiques de traduction…»

Pierre François Gagnon, fondateur d'Éditel et pionnier de l'édition littéraire francophone en ligne, écrit en juillet 2000: «Je pense que, si les diverses langues de la planète vont occuper chacune l'internet en proportion de leur poids démographique respectif, la nécessité d'une langue véhiculaire unique se fera sentir comme jamais auparavant, ce qui ne fera qu'assurer davantage encore la suprématie planétaire de l'anglais, ne serait-ce que du fait qu'il a été adopté définitivement par l'Inde et la Chine. Or la marche de l'histoire n'est pas plus comprimable dans le dé à coudre d'une quelconque équation mathématique que le marché des options en bourse!»

Philippe Loubière, traducteur littéraire et dramatique, dénonce pour sa part la main-mise anglophone sur le réseau. «Tout ce qui peut contribuer à la diversité linguistique, sur internet comme ailleurs, est indispensable à la survie de la liberté de penser, explique-t-il en mars 2001. Je n'exagère absolument pas: l'homme moderne joue là sa survie. Cela dit, je suis très pessimiste devant cette évolution. Les Anglo-saxons vous écrivent en anglais sans vergogne. L'immense majorité des Français constate avec une indifférence totale le remplacement progressif de leur langue par le mauvais anglais des marchands et des publicitaires, et le reste du monde a parfaitement admis l'hégémonie linguistique des Anglo-saxons parce qu'ils n'ont pas d'autres horizons que de servir ces riches et puissants maîtres. La seule solution consisterait à recourir à des législations internationales assez contraignantes pour obliger les gouvernements nationaux à respecter et à faire respecter la langue nationale dans leur propre pays (le français en France, le roumain en Roumanie, etc.), cela dans tous les domaines et pas seulement sur internet. Mais ne rêvons pas…»

C'est aussi le sentiment de Blaise Rosnay, webmestre du site du Club des poètes, qui écrit en janvier 2000: «Dans la mesure où la culture française, y compris contemporaine, pourra être diffusée sans obstacles, la langue française aura la possibilité de rester vivante sur le réseau. Ses oeuvres, liées au génie de notre langue, susciteront nécessairement de l'intérêt puisqu'elles sont en prise avec l'évolution actuelle de l'esprit humain. Dans la mesure où il y aura une volonté d'utiliser l'internet comme moyen de partage de la connaissance, de la beauté, de la culture, toutes les langues, chacune avec leur génie propre, y auront leur place. Mais si l'internet, comme cela semble être le cas, abandonne ces promesses pour devenir un lieu unique de transactions commerciales, la seule langue qui y sera finalement parlée sera une sorte de jargon dénaturant la belle langue anglaise, je veux dire un anglais amoindri à l'usage des relations uniquement commerciales.»

Richard Chotin, professeur à l'École supérieure des affaires (ESA) de Lille, rappelle à juste titre que la suprématie de l'anglais a succédé à celle du français. «Le problème est politique et idéologique, explique-t-il en septembre 2000. C'est celui de l'"impérialisme" de la langue anglaise découlant de l'impérialisme américain. Il suffit d'ailleurs de se souvenir de l'"impérialisme" du français aux 18e et 19e siècles pour comprendre la déficience en langues des étudiants français: quand on n'a pas besoin de faire des efforts pour se faire comprendre, on n'en fait pas, ce sont les autres qui les font.»

Bakayoko Bourahima, bibliothécaire de l'École nationale supérieure de statistique et d'économie appliquée (ENSEA) d'Abidjan (Côte d'Ivoire), écrit en juillet 2000: «Pour nous les Africains francophones, le diktat de l'anglais sur la toile représente pour la masse un double handicap d'accès aux ressources du réseau. Il y a d'abord le problème de l'alphabétisation qui est loin d'être résolu et que l'internet va poser avec beaucoup plus d'acuité, ensuite se pose le problème de la maîtrise d'une seconde langue étrangère et son adéquation à l'environnement culturel. En somme, à défaut de multilinguisme, l'internet va nous imposer une seconde colonisation linguistique avec toutes les contraintes que cela suppose. Ce qui n'est pas rien quand on sait que nos systèmes éducatifs ont déjà beaucoup de mal à optimiser leurs performances, en raison, selon certains spécialistes, des contraintes de l'utilisation du français comme langue de formation de base. Il est donc de plus en plus question de recourir aux langues vernaculaires pour les formations de base, pour "désenclaver" l'école en Afrique et l'impliquer au mieux dans la valorisation des ressources humaines. Comment faire? Je pense qu'il n'y a pas de chance pour nous de faire prévaloir une quelconque exception culturelle sur la toile, ce qui serait de nature tout à fait grégaire. Il faut donc que les différents blocs linguistiques s'investissent beaucoup plus dans la promotion de leur accès à la toile, sans oublier leurs différentes spécificités internes.»

Lucie de Boutiny, romancière, écrit en septembre 2000: "Les chiffres de septembre 2000 montrent que 51% des utilisateurs sont anglo-saxons, et 78% des sites aussi. Les chiffres de cette prépondérance baissent à mesure qu'augmentent le nombre des internautes de par le monde… L'anglais va devenir la deuxième langue mondiale après la langue natale, mais il y en aura d'autres. Un exemple: personnellement, à l'âge de 4 ans, je parlais trois langues alors que je ne savais ni lire ni écrire. Pour parler une langue, il peut suffire d'avoir la chance de l'écouter. On peut espérer que le cosmopolitisme traverse toutes les classes sociales en raison, par exemple, de l'Union européenne, du nomadisme des travailleurs, de la facilité de déplacement à l'étranger des étudiants, de la présence des chaînes TV et sites étrangers, etc."

Gérard Fourestier, créateur de Rubriques à Bac, un site destiné aux étudiants du premier cycle universitaire, écrit en octobre 2000: «Je suis de langue française. J'ai appris l'allemand, l'anglais, l'arabe, mais je suis encore loin du compte quand je surfe dans tous les coins de la planète. Il serait dommage que les plus nombreux ou les plus puissants soient les seuls qui "s'affichent" et, pour ce qui est des logiciels de traduction, il y a encore largement à faire. (…) Pour l'instant, [il importe] de connaître suffisamment d'anglais et de créer beaucoup plus encore en français.»

= Des solutions logicielles

Alain Bron, consultant en systèmes d'information et écrivain, explique pour sa part en novembre 1999: «Il y aura encore pendant longtemps l'usage de langues différentes et tant mieux pour le droit à la différence. Le risque est bien entendu l'envahissement d'une langue au détriment des autres, donc l'aplanissement culturel. Je pense que des services en ligne vont petit à petit se créer pour pallier cette difficulté. Tout d'abord, des traducteurs pourront traduire et commenter des textes à la demande, et surtout les sites de grande fréquentation vont investir dans des versions en langues différentes, comme le fait l'industrie audiovisuelle.»

Tôt ou tard, le pourcentage des langues sur le réseau correspondra-t-il à leur répartition sur la planète? Rien n'est moins sûr à l'heure de la fracture numérique entre riches et pauvres, entre zones rurales et zones urbaines, entre régions favorisées et régions défavorisées, entre l'hémisphère nord et l'hémisphère sud, entre pays développés et pays en développement.

Selon Zina Tucsnak, ingénieur d'études au laboratoire ATILF (Analyse et traitement informatique de la langue française), interviewée en octobre 2000, "le meilleur moyen serait l'application d'une loi par laquelle on va attribuer un "quota" à chaque langue. Mais n'est-ce pas une utopie de demander l'application d'une telle loi dans une société de consommation comme la nôtre?"

À la même date, Emmanuel Barthe, documentaliste juridique, exprime un avis contraire: «Des signes récents laissent penser qu'il suffit de laisser les langues telles qu'elles sont actuellement sur le web. En effet, les langues autres que l'anglais se développent avec l'accroissement du nombre de sites web nationaux s'adressant spécifiquement aux publics nationaux, afin de les attirer vers internet. Il suffit de regarder l'accroissement du nombre de langues disponibles dans les interfaces des moteurs de recherche généralistes. Il serait néanmoins utile (et bénéfique pour un meilleur équilibre des langues) de disposer de logiciels de traduction automatique de meilleure qualité et à très bas prix sur internet. La récente mise sur le web du GDT (Grand dictionnaire terminologique, rédigé par l'Office de la langue française du Québec) va dans ce sens.»

Michel Benoît, romancier vivant à Montréal (Québec), écrit en juin 2000: «Lorsqu'un problème affecte une structure, quelle qu'elle soit, j'ai toujours tendance à imaginer que c'est techniquement que le problème trouve sa solution. Vous connaissez cette théorie? Si les Romains avaient trouvé le moyen d'enlever le plomb de leur couvert d'étain, Néron ne serait jamais devenu fou et n'aurait jamais incendié Rome. Escusi, farfelu? Peut-être que oui, peut-être que non. E que save? L'internet multilingue? Demain, ou après-demain au plus. Voyons, pensez au premier ordinateur, il y a de cela un peu plus que cinquante ans. Un étage au complet pour faire à peine plus que les quatre opérations de base. Dans ce temps-là, un bug, c'était véritablement une mouche - ou autre insecte - qui s'insérait entre les lecteurs optiques. De nos jours [en 2000], un carte de 3 cm x 5 cm fait la même chose. La traduction instantanée: demain, après-demain au plus.»

C'est aussi l'avis de Pierre Magnenat, responsable de la cellule «gestion et prospective» du centre informatique de l'Université de Lausanne, qui écrit en octobre 2000: «La seule solution que je vois serait qu'un effort majeur et global soit entrepris pour développer des traducteurs automatiques. Je ne pense pas qu'une quelconque incitation ou autre quota pourrait empêcher la domination totale de l'anglais. Cet effort pourrait - et devrait - être initié au niveau des États, et disposer des moyens suffisants pour aboutir.»

Pierre-Noël Favennec, expert à la direction scientifique de France Télécom R&D, souligne en février 2001: «Les recherches sur la traduction automatique devraient permettre une traduction automatique dans les langues souhaitées, mais avec des applications pour toutes les langues et non les seules dominantes (ex.: diffusion de documents en japonais, si l'émetteur est de langue japonaise, et lecture en breton, si le récepteur est de langue bretonne…). Il y a donc beaucoup de travaux à faire dans le domaine de la traduction automatique et écrite de toutes les langues.»

LE FRANÇAIS SUR LE WEB

= Une «nation de langue» francophone

En décembre 1997, Tim Berners-Lee, l'inventeur du World Wide Web (en 1990), déclare à Pierre Ruetschi, journaliste à la Tribune de Genève, un quotidien suisse: «Pourquoi les Francophones ne mettent-ils pas davantage d'informations sur le web? Est-ce qu'ils pensent que personne ne veut la lire, que la culture française n'a rien à offrir? C'est de la folie, l'offre est évidemment énorme.»

C'est chose faite dans les années qui suivent, d'abord par le Québec, une région dynamique qui dispose d'un accès beaucoup plus facile et économique à l'internet les premières années, et ensuite par la Francophonie dans son ensemble.

Début 1998, les Québécois, pionniers de l'internet francophone, attendent de pied ferme l'arrivée en masse de sites web français, y compris commerciaux. Lors d'un entretien publié par le magazine en ligne Multimédium, Louise Beaudouin, ministre de la Culture et des Communications au Québec, déclare en février 1998: «J'attendais depuis deux ans que la France se réveille. Aujourd'hui, je ne m'en plaindrai pas.» À cette date, le Québec (avec 6 millions d'habitants) propose plus de sites web que la France (avec 60 millions d'habitants). La ministre attribue le retard de la France à deux facteurs: d'une part les tarifs élevés du téléphone (et donc de l'internet, puisque la connexion s'effectue par le biais de la ligne téléphonique), d'autre part les transactions commerciales possibles sur le minitel (le videotex français) depuis plusieurs années, ce qui ralentit l'expansion du commerce électronique sur l'internet.

C'est l'UREC (Unité réseaux du Centre national de la recherche scientifique) qui, en France, lance le premier annuaire de sites web francophones. L'annuaire de l'UREC a pour but de se familiariser avec le web sans se noyer dans la masse d'informations mondiale, et de connaître les sites qui petit à petit fleurissent en langue française. Créé début 1994, il recense d'abord les sites académiques avant de devenir plus généraliste. D'autres annuaires voient ensuite le jour, dont certains débutés avec l'aide de l'UREC. Le nombre de sites web, y compris commerciaux, augmente de manière exponentielle, si bien que la gestion d'un annuaire généraliste devient difficile. En juillet 1997, considérant sa mission comme accomplie, l'UREC arrête la mise à jour de cet annuaire généraliste, et le remplace par un annuaire spécialisé consacré à l'enseignement supérieur et à la recherche.

Fondée en mars 1970 à Niamey (Niger) pour regrouper 21 États francophones, l'Agence la Francophonie - qui se prénomme d'abord l'Agence de coopération culturelle et technique (ACCT) - compte 47 États francophones en 1997. Cette agence se veut un «instrument de coopération multilatérale née d'un idéal, celui de créer une communauté qui fasse entendre sa voix dans le concert des nations».

Une Conférence des ministres francophones chargés des inforoutes a lieu à Montréal en mai 1997. Datée du 21 mai 1997, la Déclaration de Montréal propose de «développer une aire francophone d'éducation, de formation et de recherche; soutenir la création et la circulation de contenus francophones et contribuer à la sauvegarde et à la valorisation des patrimoines; encourager la promotion de l'aire francophone de développement économique; mettre en place une vigie francophone (veille active); sensibiliser prioritairement la jeunesse ainsi que les utilisateurs, les producteurs et les décideurs; assurer la présence et la concertation des Francophones dans les instances spécialisées.»

Par ailleurs, l'Agence universitaire de la Francophonie (AUF) crée le réseau internet REFER pour desservir la communauté scientifique et technique en Afrique, en Asie et en Europe orientale, avec 24 pays participants en 2002.

Le 20 mars 2010, la Francophonie fête ses quarante ans d'existence. L'Organisation internationale de la Francophonie (OIF) rassemble désormais 70 États et gouvernements (56 membres et 14 observateurs) totalisant 870 millions d'habitants, soit 13% de la population mondiale.

Mais, selon diverses sources, on ne recenserait en fait que 200 millions de Francophones dans le monde, dont 72 millions de «locuteurs partiels». 96,2 millions de Francophones vivraient en Afrique. Le français serait la neuvième langue de la planète et 5% des pages internet seraient rédigées en français. Tous chiffres à prendre avec précaution.

S'il est la langue des pays francophones, le français est aussi la deuxième langue utilisée dans les organisations internationales. Malgré la pression anglophone - réelle ou supposée selon les cas -, des Francophones veillent à ce que leur langue ait une place significative dans le monde, au même titre que les autres grandes langues de communication que sont l'anglais, l'arabe, le chinois et l'espagnol. Là aussi, l'optique est aussi bien la défense d'une langue que le respect du multilinguisme et de la diversité des peuples.

= Le patrimoine linguistique en ligne

L'internet peut favoriser non seulement l'usage du français, en cas de volonté politique et culturelle dans ce sens, mais aussi la transmission du patrimoine linguistique. Un exemple parmi d'autres est celui des dictionnaires anciens, qui trouvent une nouvelle vie grâce au web.

Dès 1996, le site de l'Institut national de la langue française (InaLF) offre des ressources terminologiques sur le discours littéraire des 14e au 20e siècles (contenu, sémantique, thématique), sur la langue courante (langue écrite, langue parlée, argot) et sur le discours scientifique et technique.

Christiane Jadelot, ingénieur d'études à l'INaLF-Nancy, explique en juin 1998: «Les premières pages sur l'INaLF ont été mises sur l'internet au milieu de l'année 1996, à la demande de Robert Martin, directeur de l'INaLF. J'ai participé à la mise sous internet de ces pages (…). La direction a senti la nécessité urgente de nous faire connaître par l'internet, que beaucoup d'autres entreprises utilisaient déjà pour promouvoir leurs produits. Nous sommes en effet "Unité de recherche et de service" et nous avons donc à trouver des clients pour nos produits informatisés, le plus connu d'entre eux étant la base textuelle FRANTEXT [sur l'internet depuis début 1995, NDLR], ainsi qu'une maquette du tome 14 du TLF [Trésor de la langue française]. Il était donc nécessaire de faire connaître l'ensemble de l'INaLF par ce moyen. Cela correspondait à une demande générale.»

La base FRANTEXT comprend, en mode interactif, 180 millions de mots- occurrences provenant d'une collection représentative de 3.500 unités textuelles en arts, sciences et techniques des 16e-20e siècles. Début 1998, 82 centres de recherche et bibliothèques universitaires sont abonnés, en Europe, en Australie, au Japon et au Canada, ce qui représente 1.250 postes de travail ayant accès à la base, avec une cinquantaine de sessions d'interrogations par jour.

Le Projet ARTFL (ARTFL: American and French Research on the Treasury of the French Language) est un projet commun du Centre national de la recherche scientifique (CNRS, France) et de l'Université de Chicago (Illinois, États-Unis). À l'origine, ce projet a pour but de constituer une base de données de 2.000 textes des 13e-20e siècles ayant trait à la littérature, la philosophie, les arts et les sciences.