WeRead Powered by ReaderPub
40 years / 40 años / 40 ans cover

40 years / 40 años / 40 ans

Chapter 16: DISTRIBUTED PROOFREADERS A DIX ANS [FR]
Open in WeRead

About This Book

This trilingual volume traces the evolution of a volunteer-driven digital library from the first public e-text in 1971 through technological and organizational milestones: the arrival of the web, the emergence of distributed proofreading networks, and the expansion to mirror sites and CD/DVD distributions. It outlines a deliberately minimal administrative model that preserves volunteer flexibility, surveys partnerships with other national digital libraries, and presents usage statistics and methods for dissemination. It also examines multilingual ambitions and the prospect of machine and hybrid machine-human translation to broaden access to literary classics, while describing funding practices, volunteer roles, and practical steps used to produce and share electronic texts.

It is hoped machine translation software will be able to convert the ebooks from one to another of 100 languages. In ten years from now, machine translation may be judged 99% satisfactory - research is active on that front, and software is improving fast - allowing for the reading of literary classics in a choice of many languages. Project Gutenberg is also interested in combining translation software and human translators, somewhat as OCR software is now combined with the work of proofreaders.

40 years after the beginning of Project Gutenberg, Michael Hart describes himself as a workaholic who has devoted his entire life to his project. He considers himself a pragmatic and farsighted altruist. For years he was regarded as a nut but now he is respected. He wants to change the world through freely-available ebooks that can be used and copied endlessly, and reading and culture for everyone at minimal cost.

Project Gutenberg's mission can be stated in eight words: "To encourage the creation and distribution of ebooks," by everybody, and by every possible means, while implementing new ideas, new methods, and new software.

DESDE EL PASADO HACIA EL FUTURO [ES]

Los resultados del Proyecto Gutenberg no se miden solo en cifras. Los resultados se miden tambien por la influencia que ha tenido el proyecto, pues esta ha sido enorme.

# Otras bibliotecas digitales

El Proyecto Gutenberg - primera pagina web de informacion en el internet y primera biblioteca digital -, inspira muchas otras bibliotecas digitales, por ejemplo el Projekt Runeberg para la literatura escandinava o el Projekt Gutenberg-DE para la literatura alemana.

El Projekt Runeberg es la primera biblioteca digital sueca de libros del dominio publico, y un socio del Proyecto Gutenberg. Esta biblioteca es creada en diciembre de 1992 por Lysator, un club informatico de estudiantes, en colaboracion con la biblioteca de la Universidad de Linkoeping (Suecia), para producir y organizar versiones electronicas gratuitas de obras de literatura nordica (escandinava) clasica. 200 obras estan disponibles en 1998, con una lista de 6.000 autores nordicos para el desarrollo de las colecciones futuras.

El Projekt Gutenberg-DE es la primera biblioteca digital alemana de libros del dominio publico, y tambien un socio del Proyecto Gutenberg. Se pueden leer decenas de textos en linea en 1998, con una pagina web para textos cortos y varias paginas web - uno por capitulo - para obras mas largas. Una lista alfabetica de autores y de titulos esta disponible en el sitio, con una breve biografia y bibliografia para cada autor.

# Una estructura tan simple como posible

La estructura administrativa y financiera del Proyecto Gutenberg se limita al minimo estricto. Michael Hart insiste frecuentemente sobre la necesidad de preservar un marco lo mas flexible posible que deje campo libre a los voluntarios, y la puerta abierta para las nuevas ideas. El objetivo es garantizar la perennidad del proyecto, sin depender ni de creditos y cortes de creditos, ni de las prioridades culturales, financieras y politicas del momento. De este modo no puede ejercerse ninguna forma de presion por el poder o el dinero. Ademas esto significa respeto para con los voluntarios, quienes pueden estar seguros de que veran su trabajo utilizado durante muchos anos. En cuanto a la supervision regular del proyecto, se garantiza gracias a cartas de informacion semanales y mensuales, foros de discusion, wikis y blogs.

Las donaciones sirven para financiar ordenadores y escaneres, y para enviar CD y DVD gratuitos a aquellos que los solicitan. Despues del CD "Best of Gutenberg" disponible en agosto de 2003 con una seleccion de 600 libros y de un primer DVD disponible en diciembre de 2003 con 9.400 libros, un segundo DVD esta disponible en julio de 2006 con 17.000 libros. A partir de 2005, CD y DVD ambos estan disponibles en el sitio web de BitTorrent, bajo la forma de imagenes ISO que se pueden descargar con el fin de grabar CD y DVD a titulo personal. En 2007, el Proyecto Gutenberg envia 15 millones de libros por correo postal bajo la forma de CD y DVD.

Aunque demasiadas veces se silencie, cabe recordar que el verdadero inventor del ebook es Michael Hart. Si tomamos la palabra "ebook" en su sentido etimologico - a saber un libro digital para difusion bajo la forma de un archivo electronico - habria nacido con el Proyecto Gutenberg en julio de 1971, 30 anos antes de los diversos lanzamientos comerciales que salpicaron el principio de los anos 2000 con los ebooks de Amazon, Barnes & Noble, Gemstar y demas.

# Decenas de miles de descargas al dia

La demanda es enorme, a prueba de ello el numero de descargas, que se cifran en decenas de miles diarias.

A fecha del 31 de julio de 2005, se cuenta con 37.532 archivos descargados al dia, 243.808 archivos a la semana y 1.154.765 archivos al mes.

A fecha del 6 de mayo de 2007, se cuenta con 89.841 archivos descargados al dia, 697.818 archivos a la semana y 2.995.436 archivos al mes.

A fecha del 15 de noviembre de 2010, se cuenta con 130.524 archivos descargados al dia, 888.520 archivos a la semana y 3.582.153 archivos al mes.

Y esto solo concierne el sitio web de descargas principal, ibiblio.org (basado en la Universidad de Carolina del Norte, Estados Unidos), que alberga tambien el sitio web del Proyecto Gutenberg. El segundo sitio web de descargas es el del Internet Archive, que tambien sirve de copia de seguridad y le proporciona al Proyecto Gutenberg une capacidad de almacenamiento ilimitada.

Un Top 100 inventaria los cien titulos y los cien autores que mas han sido descargados durante el dia, la semana y el mes.

El Proyecto Gutenberg dispone de 40 sitios web espejo repartidos en toda la planeta, y aun necesita encontrar otros. Los archivos tambien circulan en modo P2P (peer-to-peer), lo que permite a cualquier utilizador intercambiar directamente archivos con otro utilizador.

Los libros del Proyecto Gutenberg pueden ayudar a colmar la fractura digital. Es muy sencillo descargarlos en un ordenador o un dispositivo movil de segunda mano que no cuestan mas de unos dolares o decenas de dolares.

# Hacia el futuro

Mas adelante, quizas se pueda contemplar la idea de una traduccion simultanea a unos cien idiomas, utilizando un programa de traduccion automatica con un margen de fiabilidad del orden de 99% en el futuro. Los textos generados por el software de traduccion automatica pasarian luego en manos de traductores (no maquinas, sino seres humanos) para hacerles algunos retoques, siguiendo un modelo parecido al de la tecnologia OCR, que no puede prescindir de los correctores (no de los software, sino de los seres humanos) para ofrecer un contenido de calidad optima.

Cuarenta anos despues de la creacion del Proyecto Gutenberg, Michael Hart se define aun como un adicto al trabajo que sigue dedicandose enteramente a su proyecto, proyecto que en su opinion esta al origen de una revolucion neo-industrial. Se define tambien a si mismo como un altruista, pragmatico y visionario. Tras haber sido tildado de chiflado durante anos, ahora suscita el respeto.

Con el pasar de los anos, la mision del Proyecto Gutenberg nunca ha dejado de ser la misma, a saber la de cambiar el mundo mediante el ebook gratuito, de uso infinito y repetible. El objetivo tambien sigue siendo el mismo, es decir la lectura gratis y la cultura para todos.

En cuanto a la mision, se resume en pocas palabras: "fomentar la creacion y la distribucion de los ebooks", por cuantas personas sea posible, por todos los medios posibles, y aceptando tambien los virajes necesarios para integrar nuevas ideas, nuevos metodos y nuevos soportes.

DU PASSE VERS L'AVENIR [FR]

Les resultats du Projet Gutenberg ne se mesurent pas seulement a des chiffres. Les resultats se mesurent aussi a l'influence du projet, qui est considerable.

# D'autres bibliotheques numeriques

Premier site d'information sur l'internet et premiere bibliotheque numerique, le Projet Gutenberg inspire bien d'autres bibliotheques numeriques au fil des ans, a commencer par le Projekt Runeberg pour la litterature scandinave et le Projekt Gutenberg-DE pour la litterature allemande.

Le Projekt Runeberg est la premiere bibliotheque numerique suedoise de livres du domaine public, creee en decembre 1992 par Lysator, un club informatique d'etudiants, en collaboration avec la bibliotheque de l'Universite de Linkoeping (Suede). Le but est de produire et organiser des versions electroniques gratuites de la litterature nordique classique. 200 oeuvres sont disponibles en 1998, avec une liste de 6.000 auteurs nordiques en tant qu'outil de developpement des collections.

Projekt Gutenberg-DE est la premiere bibliotheque numerique allemande de livres du domaine public. Plusieurs dizaines de textes peuvent etre lus en ligne en 1998, avec une page web pour les textes courts et plusieurs pages - une par chapitre - pour les oeuvres plus longues. Une liste alphabetique d'auteurs et de titres est egalement disponible, ainsi qu'une courte biographie et bibliographie pour chaque auteur.

# Une structure aussi simple que possible

La structure administrative et financiere du Projet Gutenberg se limite au strict minimum, avec une devise qui tient en trois mots: "Less is more". Michael Hart insiste regulierement sur la necessite d'un cadre aussi souple que possible laissant toute initiative aux volontaires, et la porte grande ouverte aux idees nouvelles. Le but est d'assurer la perennite du projet independamment des credits, des coupures de credits et des priorites culturelles, financieres et politiques du moment. Pas de pression possible donc par le pouvoir et par l'argent. Et respect a l'egard des volontaires, qui sont assures de voir leur travail utilise pendant de nombreuses annees. Le suivi regulier du projet est assure grace a une lettre d'information hebdomadaire et mensuelle, des forums de discussion, des wikis et des blogs.

Les dons servent a financer des ordinateurs et des scanners, et a envoyer des CD et DVD gratuits a tous ceux qui en font la demande. Suite au CD Best of Gutenberg disponible en aout 2003 avec une selection de 600 titres, un premier DVD est disponible en decembre 2003 avec 9.400 titres, suivi d'un deuxieme DVD disponible en juillet 2006 avec 17.000 titres. A partir de 2005, CD et DVD sont disponibles sous forme d'images ISO sur le site de BitTorrent, ces images pouvant etre telechargees pour graver des CD et DVD sur place a titre personnel. En 2007, le Projet Gutenberg envoie 15 millions de livres par voie postale sous forme de CD et DVD.

Chose souvent passee sous silence, Michael Hart est le veritable inventeur de l'ebook. Si on considere l'ebook dans son sens etymologique, a savoir un livre numerise pour diffusion sous forme de fichier electronique, celui-ci serait ne avec le Projet Gutenberg en juillet 1971, trente ans avant les divers lancements commerciaux ayant emaille le debut des annees 2000 avec les ebooks d'Amazon, Barnes & Noble, Gemstar et autres.

# Des dizaines de milliers de telechargements par jour

La demande est enorme. En temoigne le nombre de telechargements, qui se comptent en dizaines de milliers par jour.

A la date du 31 juillet 2005, on compte 37.532 fichiers telecharges dans la journee, 243.808 fichiers telecharges dans la semaine et 1.154.765 fichiers telecharges dans le mois.

A la date du 6 mai 2007, on compte 89.841 fichiers telecharges dans la journee, 697.818 fichiers telecharges dans la semaine et 2.995.436 fichiers telecharges dans le mois. Courant mai, ce nombre atteint les 3 millions.

A la date du 15 novembre 2010, on compte 130.524 fichiers telecharges dans la journee, 888.520 fichiers telecharges dans la semaine et 3.582.153 fichiers telecharges dans le mois.

Ceci uniquement pour le principal site de telechargement, ibiblio.org (base a l'Universite de Caroline du Nord, aux Etats-Unis), qui heberge aussi le site du Projet Gutenberg. Le deuxieme site de telechargement est l'Internet Archive, qui est le site de sauvegarde et qui met a la disposition du Projet Gutenberg une capacite de stockage illimitee.

Un "Top 100" recense les cent titres et les cent auteurs les plus telecharges dans la journee, dans la semaine et dans le mois.

Le Projet Gutenberg dispose de 40 sites miroirs repartis sur toute la planete, et il en cherche d'autres. La circulation des fichiers se fait aussi en mode P2P (Peer-to-Peer), qui permet d'echanger des fichiers directement d'un utilisateur a l'autre.

Les livres du Projet Gutenberg peuvent aider a combler la fracture numerique. Ils sont aisement telechargeables sur un ordinateur ou un netbook d'occasion ne coutant que quelques dollars ou quelques dizaines de dollars.

# Vers l'avenir

Plus tard, il sera peut-etre possible d'envisager une traduction simultanee dans une centaine de langues, en utilisant un logiciel de traduction automatique qui aurait alors un taux de fiabilite de l'ordre de 99%, un pourcentage dont on est encore loin. Ce logiciel de traduction automatique serait relaye par des traducteurs (non pas des machines, mais des etres humains), sur un modele comparable a la technologie OCR actuellement relayee par des correcteurs (non pas des logiciels, mais des etres humains) pour offrir un contenu de grande qualite.

Quarante ans apres les debuts du Projet Gutenberg, Michael Hart se definit toujours comme un fou de travail dediant toute sa vie a son projet, qu'il voit comme etant a l'origine d'une revolution neo- industrielle. Il se definit aussi comme altruiste, pragmatique et visionnaire. Apres avoir ete traite de toque pendant de nombreuses annees, il force maintenant le respect.

Au fil des ans, la mission du Projet Gutenberg reste la meme, a savoir changer le monde par le biais de l'ebook gratuit indefiniment utilisable et reproductible, et favoriser ainsi la lecture et la culture pour tous a moindres frais.

Cette mission se resume en quelques mots: "encourager la creation et la distribution d'ebooks", par autant de personnes que possible, et par tous les moyens de diffusion possibles, tout en prenant les virages necessaires pour integrer de nouvelles idees, de nouvelles methodes et de nouveaux supports.

PROJECT GUTENBERG AND LANGUAGES [EN]

Project Gutenberg mainly offers English-language ebooks, but multilingualism has become one of its priorities. French is the second language of the project. There were ebooks in 60 languages in December 2010.

# In 1990-94

Initially, the ebooks were in English. As Project Gutenberg was launched from the University of Illinois (United States), with the help of English-speaking volunteers, its first goal has been to provide ebooks to the English-language community, that is to say 95% of internet users in the early 1990s. (Non-English-speaking users reached 50% in summer 2000, with a percentage steadily growing ever since.)

Project Gutenberg was also inspiring other digital libraries elsewhere.
Projekt Runeberg, for classic Nordic literature, and Projekt Gutenberg-
DE, for classic German literature, started respectively in 1992 and
1994.

Projekt Runeberg was the first Swedish digital library of books from public domain, and a partner of Project Gutenberg. It was created by the students' computer club Lysator, in cooperation with Linkoeping University, as a volunteer project to produce and organize free electronic editions of classic Nordic (Scandinavian) literature. Around 200 ebooks were available in 1998, with a list of 6,000 Nordic authors as a tool for further collection development.

Projekt Gutenberg-DE was the first German digital library of books from public domain, and also a partner of Project Gutenberg. A number of texts were available for online reading in 1998, with one web page for short texts and several web pages - one per chapter - for longer works. There was an alphabetic list of authors and titles, with a short biography and bibliography for each author.

# In 1997

French was the second language of Project Gutenberg, and still is in 2010.

The first ebooks released in French were six works by Stendhal and two works by Jules Verne, all released in early 1997.

The six works by Stendhal were four short novels: L'Abbesse de Castro (published in 1837), Les Cenci (1837), Vittoria Accoramboni (1837) and La Duchesse de Palliano (1838), and two novels: Le Rouge et le Noir (1830) and La Chartreuse de Parme (1839).

The two novels by Jules Verne were: De la terre a la lune (1865) and Le tour du monde en quatre-vingts jours (1873).

Three novels by Jules Verne were already available in English: From the Earth to the Moon (original title: De la terre a la lune), released in September 1993; Around the World in 80 Days (original title: Le tour du monde en quatre-vingts jours), released in January 1994; and 20,000 Leagues Under the Seas (original title: Vingt mille lieues sous les mers, 1869-70), released in September 1994.

Since then, Jules Verne has constantly been in the most downloaded authors, at 11 in the "Top 20" available on the website of Project Gutenberg in December 1999, and at 6 in the "Top 100 during the last 30 days", on October 7, 2010.

As a side remark, the first pictures ever made available in Project Gutenberg were French Cave Paintings, released in April 1995 as eBook #249, with an XHTML version available in November 2000. This ebook offers four copyrighted photographs of paleolithic paintings found in a grotto in Ardeche, a region of south-western France. The photographs were sent to Project Gutenberg by Jean Clottes, a general curator for cultural heritage (conservateur general du patrimoine), for everyone to enjoy them.

Released in August 1997, eBook #1000 was La Divina Commedia (1321) de Dante Alighieri, in Italian, its original language.

# In 1998

In October 1997, Michael Hart expressed his intention to produce more ebooks in other languages. In early 1998, there were a few titles in French, German, Italian, Spanish, and Latin.

Stendhal and Jules Verne were followed by Edmond Rostand with Cyrano de Bergerac, published in 1897 and released in Project Gutenberg 100 years later, in March 1998.

# In 1999

Released in May 1999, eBook #2000 was Don Quijote (1605), by Cervantes, in Spanish, its original language.

In July 1999, Michael Hart wrote in an email interview: "I am publishing in one new language per month right now, and will continue as long as possible."

# In 2000

Released in December 2000, eBook #3000 was A l'ombre des jeunes filles en fleurs (In the Shadow of Young Girls in Flower), vol. 3 (1919), by Marcel Proust, in French, its original language.

# In 2001

Project Gutenberg Australia was launched in July 2001, and began producing ebooks in English and in other languages, for example some volumes in French of A la recherche du temps perdu (In Search of Lost Time, 1913-27) by Marcel Proust. (The last volumes of Proust's masterpiece are still copyrighted in the United States, the reason why they are lacking in Project Gutenberg's main website.) 1,750 ebooks were available in Project Gutenberg Australia in February 2009.

Released in October 2001, eBook #4000 was The French Immortals Series (1905), in English. This book is an anthology of short fictions by authors from the French Academy (Academie francaise): Emile Souvestre, Pierre Loti, Hector Malot, Charles de Bernard, Alphonse Daudet, and others.

# In 2002

Released in April 2002, eBook #5000 was The Notebooks of Leonardo da Vinci (early 16th century), as an English translation from Italian, its original language. Since its release, this ebook has regularly stayed in the "Top 100" of downloaded ebooks.

# In 2003

The Project Gutenberg Consortia Center (PGCC) was affiliated with Project Gutenberg in 2003, and became a sister project. Since 1997, PGCC has been working on gathering collections of ebooks from other sources, in a number of formats and languages, with 75,000 ebooks in 2010.

# In 2004

In early 2004, there were works in 25 languages in Project Gutenberg.

In February 2004, Michael Hart went off to Europe, with stops in Paris,
France; Brussels, Belgium; and Belgrade, Serbia.

He gave a lecture on February 12, 2004 at the headquarters of UNESCO
(United Nations Educational, Scientific and Cultural Organization) in
Paris. He chaired a discussion at the French National Assembly on
February 13.

The following week, he addressed the European Parliament, in Brussels.

Then he went to Belgrade to meet with the team of Project Rastko and support the launching of Project Gutenberg Europe and Distributed Proofreaders Europe.

Project Rastko, a non-governmental cultural and educational project, was founded in 1997 in Belgrade as part of the Balkans Cultural Network Initiative, a regional network for the Balkan peninsula in south- eastern Europe.

Distributed Proofreaders Europe (DP Europe) has used the software of the original Distributed Proofreaders, created in 2000 by Charles Franks to share the correction of ebooks among many volunteers.

DP Europe has offered a plurilingual interface right from the start, with its main pages translated into 12 European languages by volunteer translators as soon as April 2004. The long-term goal was 60 languages, for the interface to be available in most European languages.

# In 2005

In May 2005, DP Europe finished processing its 100th ebook. These ebooks were in several languages, as a reflection of European linguistic diversity. DP Europe has supported Unicode to be able to proofread ebooks in many languages. 600 ebooks were available in February 2009.

In July 2005, there were works in 42 languages in Project Gutenberg, including Sanskrit and the Mayan languages. The seven main languages were English (with 14,548 ebooks on July 27, 2005), French (577 ebooks), German (349 ebooks), Finnish (218 ebooks), Dutch (130 ebooks), Spanish (103 ebooks), and Chinese (69 ebooks).

# In 2006

Released in December 2006, eBook #20000 was the audiobook of Twenty Thousand Leagues Under the Sea (Vingt mille lieues sous les mers, 1869), by Jules Verne, in its English version.

In December 2006, there were ebooks in 50 languages. The ten main languages were English (with 17,377 ebooks on December 16, 2006), French (966 ebooks), German (412 ebooks), Finnish (344 ebooks), Dutch (244 ebooks), Spanish (140 ebooks), Italian (102 ebooks), Chinese (69 ebooks), Portuguese (68 ebooks), and Tagalog (51 ebooks).

# In 2007

Project Gutenberg Canada (PGC) was launched on July 1st, 2007, on
Canada Day. Distributed Proofreaders Canada (DPC) started production in
December 2007, with 100 ebooks in English, French, and Italian in March
2008, and 250 ebooks in February 2009.

# In 2010

On October 7, 2010, there were works in 59 languages in Project Gutenberg. The ten main languages were English (with 28,441 ebooks), French (1,659 ebooks), German (709 ebooks), Finnish (536 ebooks), Dutch (496 ebooks), Portuguese (473 ebooks), Chinese (405 ebooks), Spanish (295 ebooks), Italian (250 ebooks), and Greek (101 ebooks). They were followed by Latin, Esperanto, Swedish, and Tagalog.

# In 2020, may be

It is hoped machine translation software will be able to convert the ebooks from one to another of many languages.

In ten years from now, machine translation may be judged 99% satisfactory - research is active on that front, and software is quickly improving - allowing for the reading of literary classics in a choice of many languages.

The machine translated ebooks won't compete with the work of literary translators and their labor of love during days and months if not years, but they would allow readers to get the gist of some literary works that have never been translated so far, or only translated in a few languages, for commercial reasons.

The output of translation software could then be proofread by human translators, in a similar way the output of OCR software is proofread by the volunteers of Distributed Proofreaders.

So, may be, we will see Distributed Translators one day, as a partner or sister project of Distributed Proofreaders and Project Gutenberg?

EL PROYECTO GUTENBERG Y LOS IDIOMAS [ES]

El Proyecto Gutenberg ofrece libros digitales en ingles en su gran mayoria, pero el multilingueismo es una de sus prioridades. El frances es el segundo idioma del proyecto. Las collecciones reunen libros en 60 idiomas - incluso en espanol - en diciembre de 2010.

# En 1990-1994

Al principio los libros digitales estan en ingles. Como el Proyecto Gutenberg fue lanzado desde la Universidad de Illinois (Estados Unidos), con la ayuda de voluntarios de habla inglesa, su proposito inicial es proporcionar libros a la comunidad anglofona, es decir el 95% de los usuarios del internet a principios de 1990. (Los non anglofonos representaran el 50% de los usuarios en el verano de 2000, con un porcentaje que seguira creciendo durante los anos siguientes.)

El Proyecto Gutenberg tambien inspira dos otras bibliotecas digitales en Europa, el Projekt Runeberg en 1992 para la literatura nordica y el Projekt Gutenberg-DE en 1994 para la literatura alemana.

El Projekt Runeberg es la primera biblioteca digital sueca de libros del dominio publico, y un socio del Proyecto Gutenberg. Esta biblioteca es creada en diciembre de 1992 por Lysator, un club informatico de estudiantes, en colaboracion con la biblioteca de la Universidad de Linkoeping (Suecia), para producir y organizar versiones electronicas gratuitas de obras de literatura nordica (escandinava) clasica. 200 obras estan disponibles en 1998, con una lista de 6.000 autores nordicos para el desarrollo de las colecciones futuras.

El Projekt Gutenberg-DE es la primera biblioteca digital alemana de libros del dominio publico, y tambien un socio del Proyecto Gutenberg. Se pueden leer decenas de textos en linea en 1998, con una pagina web para textos cortos y varias paginas web - uno por capitulo - para obras mas largas. Una lista alfabetica de autores y de titulos esta disponible en el sitio, con una breve biografia y bibliografia para cada autor.

# En 1997

El frances llego a ser la segunda lengua del Proyecto Gutenberg, y sigue siendolo en 2010.

Los primeros libros en frances son seis obras de Stendhal y dos obras de Jules Verne, todas disponibles a principios de 1997.

Las dos novelas de Jules Verne son: De la terre a la lune (1865) y Le tour du monde en quatre-vingts jours (1873).

En aquella fecha, tres novelas de Jules Verne ya estan disponibles en ingles: From the Earth to the Moon (titulo original: De la terre a la lune), disponible en septiembre de 1993; Around the World in 80 Days (titulo original: Le tour du monde en quatre-vingts jours), disponible en enero de 1994; y 20,000 Leagues Under the Sea (titulo original: Vingt mille lieues sous les mers, 1869-1870), disponible en septiembre de 1994.

Desde la publicacion de estos primeros libros digitales, Jules Verne siempre ha sido parte de los autores mas descargados. Era el undecimo autor en el "Top 20 de autores" mas descargados en diciembre de 1999. Era el sexto autor en el "Top 100 de autores" mas descargados en los ultimos treinta dias en la fecha del 15 de noviembre de 2010.

En agosto de 1997, el Proyecto Gutenberg pone en linea el eBook #1000, La Divina Commedia (La Divina Comedia) de Dante Alighieri (publicada en 1321), en italiano, su idioma original.

# En 1998-2000

En octubre de 1997, Michael Hart anuncia su intencion de aumentar la produccion de libros en otros idiomas que el ingles. A principios de 1998, el catalogo incluye obras en aleman, espanol, frances, italiano y latin.

Disponible en mayo de 1999, el eBook #2000 es Don Quijote (1605), en castellano, su idioma original.

En julio de 1999, Michael escribe en una entrevista por correo electronico: "Ahora anado un nuevo idioma cada mes, y voy a seguir haciendolo todo el tiempo sea posible."

Disponible en diciembre de 2000, el eBook #3000 es el tercer volumen de A l'ombre des jeunes filles en fleurs (A la sombra de las muchachas en flor, 1919) de Marcel Proust, en frances, su idioma original.

# En 2001

El Proyecto Gutenberg Australia - creado en julio de 2001 - inaugura la produccion de libros digitales en ingles y en otros idiomas, por ejemplo algunos volumenes en frances de A la recherche du temps perdu (En busca del tiempo perdido, 1913-1927) de Marcel Proust. (Los ultimos volumenes todavia estan bajo copyright en los Estados Unidos, y no estan disponibles en el Proyecto Gutenberg). El Proyecto Gutenberg Australia cuenta con 1.750 ebooks en febrero de 2009.

Disponible en octubre de 2001, el eBook #4000 es The French Immortals Series (Obras de los Inmortales franceses), en su version inglesa. Publicado en 1905 por la Maison Mazarin (Paris), este libro reune varias obras cortas de ficcion de escritores laureados por la Academia de la Lengua Francesa (Academie Francaise), como Emile Souvestre, Pierre Loti, Hector Malot, Charles de Bernard, Alphonse Daudet y otros.

# En 2002

Disponible en abril de 2002, el eBook #5000 es The Notebooks of Leonardo da Vinci (Los Cuadernos de Leonardo da Vinci), en una traduccion del italiano al ingles de este texto del siglo 16. Desde su puesta en linea, este ebook figura con regularidad en el "Top 100" de los libros mas descargados.

# En 2003

El Project Gutenberg Consortia Center (PGCC) - lanzado en 1997 para reunir en un punto de acceso unico colecciones de otras bibliotecas - esta afiliado oficialmente al Proyecto Gutenberg en 2003. Este sitio ofrece mas de 75.000 ebooks en varios formatos e idiomas en noviembre de 2010.

# En 2004

A principios de 2004, 25 lenguas estan representadas en el Proyecto
Gutenberg.

En febrero de 2004, Michael Hart vuela a Europa con escalas en Bruselas (Belgica), Paris (Francia) y Belgrado (Serbia). El 12 de febrero de 2004 da una conferencia en la sede de la UNESCO (Organizacion de las Naciones Unidas para la Educacion, la Ciencia y la Cultura) en Paris. Al dia siguiente, anima un debate en la Asamblea Nacional Francesa. La semana siguiente hace un discurso ante el Parlamento Europeo en Bruselas.

Despues Michael se va a reune con el equipo del Proyecto Rastko en Belgrado para apoyar el lanzamiento del Proyecto Gutenberg Europa y de Distributed Proofreaders Europa. El Proyecto Rastko es una organizacion no gubernamental con vocacion cultural y educativa fundada en 1997 como parte de una red cultural regional en la Peninsula de los Balcanes, en el sureste de Europa.

Distributed Proofreaders Europa (DP Europa) utiliza el software y la interfaz de Distributed Proofreaders, un sitio creado en octubre de 2000 por Charles Franks para repartir la revision de los libros digitales entre muchos voluntarios.

Desde sus inicios, DP Europe es un sitio plurilinguee que toma en cuenta las mayores lenguas nacionales europeas. Traducido por traductores voluntarios, el sitio de DP Europa esta disponible en doce idiomas en abril de 2004, con la intencion de proponer la interfaz en sesenta idiomas, es decir todos los (mayores) idiomas europeos.

En mayo de 2005, DP Europa completa la correccion de su centesimo libro digital. Estos libros estan en varios idiomas con el fin de reflejar la diversidad lingueistica que prevalece en Europa. La codificacion utilizada es el Unicode para corregir libros en muchos idiomas. DP Europa cuenta con 600 libros en febrero de 2009.

# En 2005

En julio de 2005, 42 lenguas estan representadas en el Proyecto Gutenberg, incluyendo el sanscrito y las lenguas mayas. Los siete principales idiomas son el ingles (con 14.548 ebooks el 27 de julio 2005), el frances (577 ebooks), en aleman (349 ebooks), el finlandes (218 ebooks), el holandes (130 ebooks), el espanol (103 ebooks) y el chino (69 ebooks).

# En 2006

Disponible en diciembre de 2006, el eBook #20000 es Twenty Thousand Leagues Under the Sea (Veinte mil leguas de viaje submarino, 1869), en una version audio en ingles.

En diciembre de 2006, 50 lenguas estan representadas en el Proyecto Gutenberg. Los diez principales idiomas son el ingles (con 17.377 ebooks el 16 de diciembre 2006), el frances (966 ebooks), el aleman (412 ebooks), el finlandes (344 ebooks), el holandes (244 ebooks), el espanol (140 ebooks), el italiano (102 ebooks), el chino (69 ebooks), el portugues (68 ebooks) y el tagalo (51 ebooks).

# En 2007

El Proyecto Gutenberg Canada (PGC) es creado el 1 de julio de 2007, el dia de la fiesta nacional de Canada. Distributed Proofreaders Canada (DPC) inicia su produccion de libros en diciembre de 2007, con 100 libros en ingles, en frances y en italiano disponibles en marzo de 2008, y 250 libros disponibles en febrero de 2009.

# En 2010

En octubre de 2010, 59 lenguas estan representadas en el Proyecto Gutenberg. Los diez principales idiomas son el ingles (con 28.441 ebooks el 7 de octubre 2010), el frances (1.659 ebooks), el aleman (709 ebooks), el finlandes (536 ebooks), el holandes (496 ebooks), el portugues (473 ebooks), el chino (405 ebooks), el espanol (295 ebooks), el italiano (250 ebooks) y el griego (101 ebooks). Estos idiomas son seguidos por el latin, el esperanto, el sueco y el tagalo.

# En 2020, quizas

Quizas podamos beneficiar en el futuro de la traduccion inmediata de estos libros a una gran variedad de idiomas, a traves de un software de traduccion automatica.

En diez anos, la traduccion automatica podria haber logrado un porcentaje de fiabilidad del 99% - la investigacion es muy activa en este campo, y los softwares son cada vez mejores - con capacidad de leer obras literarias en un gran numero de idiomas.

Los libros traducidos por un software de traduccion automatica no van a competir con el trabajo de los traductores literarios y sus esfuerzos talentosos durante dias y meses si no anos. Pero van a permitir al lector captar lo esencial de obras literarias nunca traducidas, o traducidas solo a unos pocos idiomas por razones comerciales.

Un libro traducido por un software de traduccion podra a continuacion ser corregido por traductores (seres humanos) mediante el uso de una interfaz similar a la que utilizan ahora los voluntarios de Distributed Proofreaders para la correccion de un libro digital producido por un software de OCR (reconocimiento optico de caracteres).

Asi pues, uno empieza a sonar con Distributed Translators para compartir la revision de las traducciones, como un socio de Distributed Proofreaders y del Proyecto Gutenberg.

LE PROJET GUTENBERG ET LES LANGUES [FR]

Le Projet Gutenberg propose essentiellement des livres numeriques en anglais, mais le multilinguisme est l'une de ses priorites. Le francais est la deuxieme langue du projet. Soixante langues sont representees en decembre 2010.

# En 1990-1994

A l'origine, les livres numeriques sont en anglais. Comme le Projet Gutenberg est lance a partir de l'Universite de l'Illinois (Etats- Unis), avec l'aide de volontaires anglophones, son but premier est de procurer des livres a la communaute anglophone, a savoir 95% des usagers de l'internet au debut des annees 1990. (Les usagers non anglophones atteignent les 50% en ete 2000, avec un pourcentage qui augmente regulierement ensuite.)

Le Projet Gutenberg inspire aussi d'autres bibliotheques numeriques ailleurs, a savoir le Projekt Runeberg pour la litterature nordique (scandinave) en 1992 et le Projekt Gutenberg-DE pour la litterature allemande en 1994.

Le Projekt Runeberg est la premiere bibliotheque numerique suedoise de livres du domaine public, et un partenaire du Projet Gutenberg. Elle est creee en decembre 1992 par Lysator, un club informatique d'etudiants, en collaboration avec la bibliotheque de l'Universite de Linkoeping (Suede), pour produire et organiser des versions electroniques gratuites de la litterature nordique classique. 200 oeuvres sont disponibles en 1998, avec une liste de 6.000 auteurs nordiques en tant qu'outil de developpement des collections.

Projekt Gutenberg-DE est la premiere bibliotheque numerique allemande de livres du domaine public, et egalement un partenaire du Projet Gutenberg. Plusieurs dizaines de textes peuvent etre lus en ligne en 1998, avec une page web pour les textes courts et plusieurs pages - une par chapitre - pour les oeuvres plus longues. Une liste alphabetique d'auteurs et de titres est egalement disponible, ainsi qu'une courte biographie et bibliographie pour chaque auteur.

# En 1997

Le francais fut la deuxieme langue du Projet Gutenberg, et c'est toujours le cas en 2010.

Les premiers livres disponibles en francais sont six oeuvres de Stendhal et deux oeuvres de Jules Verne, toutes mises en ligne debut 1997.

Les six oeuvres de Stendhal sont quatre recits: Les Cenci (publie en 1837), Vittoria Accoramboni (1837), La Duchesse de Palliano (1838) et L'Abbesse de Castro (1839) - tous recits publies dans La revue des deux mondes - et deux romans: Le Rouge et le Noir (1830) et La Chartreuse de Parme (1839).

Les deux romans de Jules Verne sont: De la terre a la lune (1865) et Le tour du monde en quatre-vingts jours (1873).

A cette date, trois romans de Jules Verne sont deja disponibles en anglais: From the Earth to the Moon (titre original: De la terre a la lune), disponible en septembre 1993; Around the World in 80 Days (titre original: Le tour du monde en quatre-vingts jours), disponible en janvier 1994; et 20,000 Leagues Under the Seas (titre original: Vingt mille lieues sous les mers, 1869-1870), disponible en septembre 1994.

Depuis la parution de ces premiers titres, Jules Verne a toujours fait partie des auteurs les plus telecharges, a la onzieme place dans le "Top 20" du Projet Gutenberg en decembre 1999 et a la sixieme place dans le "Top 100" des auteurs les plus telecharges durant les trente derniers jours a la date du 6 novembre 2010.

A titre anecdotique, le premier recueil d'images disponible dans le Projet Gutenberg toutes langues confondues est French Cave Paintings (Peintures des cavernes en France), mis en ligne des avril 1995 (eBook #249), avec une version XHTML ajoutee en novembre 2000. Il s'agit de quatre photos de peintures paleolithiques retrouvees dans une grotte de l'Ardeche, un departement du sud-ouest de la France. Ces photos, sous copyright, ont ete mises a la disposition du Projet Gutenberg par Jean Clottes, conservateur general du patrimoine, pour pouvoir etre appreciees de tous.

Disponible en 1997, l'eBook #1000 est La Divina Commedia (1321) de Dante Alighieri, en italien, sa langue originale.

# En 1998

En octobre 1997, Michael Hart annonce son intention d'intensifier la production de livres dans des langues autres que l'anglais. Debut 1998, le catalogue comprend quelques oeuvres en allemand, en espagnol, en francais (dix titres), en italien et en latin.

Stendhal et Jules Verne sont suivis par Edmond Rostand avec Cyrano de Bergerac, publie en 1897 et disponible dans le Projet Gutenberg un siecle plus tard, en mars 1998.

# En 1999

Disponible en mai 1999, l'eBook #2000 est Don Quijote (1605) de Cervantes, en espagnol, sa langue originale.

En juillet 1999, Michael ecrit lors d'un entretien par courriel: "J'introduis une nouvelle langue par mois maintenant, et je vais poursuivre cette politique aussi longtemps que possible."

# En 2000

Disponible en decembre 2000, l'eBook #3000 est le volume 3 (1919) de A l'ombre des jeunes filles en fleurs de Marcel Proust, en francais, sa langue originale.

Le Project Gutenberg Australia est lance en juillet 2001, et commence a produire des livres numeriques en anglais et dans d'autres langues, par exemple certains volumes en francais de A la recherche du temps perdu (1913-1927) de Marcel Proust. (Les derniers volumes sont toujours sous copyright aux Etats-Unis, raison pour laquelle ils ne sont pas disponibles sur le site americain du Projet Gutenberg.) Les collections du Project Gutenberg Australia comprennent 1.750 livres numeriques en fevrier 2009.

# En 2001

Disponible en octobre 2001, l'eBook #4000 est The French Immortals Series (Recueil de textes d'Immortels francais, 1905), en anglais. Cette anthologie regroupe des oeuvres de fiction courtes de plusieurs membres de l'Academie francaise: Emile Souvestre, Pierre Loti, Hector Malot, Charles de Bernard, Alphonse Daudet et d'autres.

# En 2002

Disponible en avril 2002, l'eBook #5000 est The Notebooks of Leonardo da Vinci (Les carnets de Leonard de Vinci), un version anglaise de ces carnets datant du 16e siecle. Ce livre est depuis regulierement present dans le "Top 100" des livres telecharges.

# En 2003

Le Project Gutenberg Consortia Center (PGCC) - fonde en 1997 pour regrouper des collections de livres numeriques emanant d'autres sources - est affilie au Projet Gutenberg en 2003 et devient l'un de ses sites officiels. Il propose plus de 75.000 titres dans divers formats et en plusieurs langues en decembre 2010.

# En 2004

Debut 2004, 25 langues sont representees dans le Projet Gutenberg.

En fevrier 2004, Michael Hart prend l'avion vers l'Europe, avec des etapes a Bruxelles (Belgique), Paris (France) et Belgrade (Serbie).

Le 12 fevrier 2004, il donne une conference au siege de l'UNESCO (Organisation des Nations Unies pour l'education, la science et la culture) a Paris. Le lendemain, toujours a Paris, il anime un debat a l'Assemblee nationale. La semaine suivante, il s'adresse au Parlement europeen a Bruxelles. Puis il va rendre visite a l'equipe du Projet Rastko a Belgrade pour soutenir le lancement du Projet Gutenberg Europe et de Distributed Proofreaders Europe.

Le Projet Rastko est un projet non gouvernemental a vocation culturelle et pedagogique fonde en 1997 et faisant partie d'un reseau culturel regional dans la peninsule des Balkans, situee au sud-est de l'Europe.

Distributed Proofreaders Europe (DP Europe) est calque sur le site original de Distributed Proofreaders, un site cree en octobre 2000 par Charles Franks pour partager la correction des livres entre de nombreux volontaires.

Des ses debuts, DP Europe est un site plurilingue, avec prise en compte des principales langues nationales europeennes. Grace a des traducteurs volontaires, le site de DP Europe est disponible en douze langues des avril 2004. L'objectif a long terme est une interface disponible en soixante langues, a savoir la plupart des langues europeennes.

# En 2005

En mai 2005, DP Europe termine la correction de son centieme livre. Ces livres sont en plusieurs langues, en tant que reflet de la diversite des langues en Europe. L'encodage utilise est l'Unicode, pour pouvoir traiter des livres dans de nombreuses langues. 600 livres sont disponibles en fevrier 2009.

En juillet 2005, 42 langues sont representees dans le Projet Gutenberg, y compris le sanscrit et les langues mayas. Les sept langues principales sont l'anglais (avec 14.548 ebooks le 27 juillet 2005), le francais (577 ebooks), l'allemand (349 ebooks), le finnois (218 ebooks), le neerlandais (130 ebooks), l'espagnol (103 ebooks) et le chinois (69 ebooks).

# En 2006

Disponible en decembre 2006, l'eBook #20000 est Twenty Thousand Leagues Under the Sea (Vingt mille lieues sous les mers, 1869) de Jules Verne, dans une version audio en langue anglaise.

En decembre 2006, 50 langues sont representees dans le Projet Gutenberg. Les dix langues principales sont l'anglais (avec 17.377 ebooks le 16 decembre 2006), le francais (966 ebooks), l'allemand (412 ebooks), le finnois (344 ebooks), le neerlandais (244 ebooks), l'espagnol (140 ebooks), l'italien (102 ebooks), le chinois (69 ebooks), le portugais (68 ebooks) et le tagalog (51 ebooks).

# En 2007

Project Gutenberg Canada (PGC) est lance le 1er juillet 2007, le jour de la fete nationale au Canada. Distributed Proofreaders Canada (DPC) debute ses activites en decembre 2007, avec 100 livres numeriques en anglais, en francais et en italien en mars 2008, et 250 livres en fevrier 2009.

# En 2010

En novembre 2010, 60 langues sont representees dans le Projet Gutenberg. Les dix langues principales sont l'anglais (avec 28.666 ebooks le 6 novembre 2010), le francais (1.672 ebooks), l'allemand (715 ebooks), le finnois (542 ebooks), le neerlandais (498 ebooks), le portugais (474 ebooks), le chinois (405 ebooks), l'espagnol (297 ebooks), l'italien (253 ebooks) et le grec (107 ebooks). Ces langues sont suivies du latin, de l'esperanto, du suedois et du tagalog.

# En 2020, peut-etre

Il est possible qu'on puisse beneficier un jour de la traduction immediate de ces livres dans un vaste choix de langues, par le biais d'un logiciel de traduction automatique.

Dans dix ans, la traduction automatique pourrait avoir atteint un taux de fiabilite de l'ordre de 99% - la recherche est tres active dans ce domaine, avec des logiciels de plus en plus performants - avec possibilite de lire des oeuvres litteraires dans un grand nombre de langues.

Les livres traduits par le biais d'un logiciel de traduction automatique ne rivaliseront certainement pas avec le travail des traducteurs litteraires et leurs efforts talentueux pendant des jours et des mois sinon des annees. Mais ils permettraient au lecteur une premiere approche d'oeuvres litteraires jamais traduites jusqu'ici, ou traduites seulement dans quelques langues, pour des raisons commerciales.

Le texte d'un livre traduit (issu d'un logiciel de traduction) pourrait ensuite etre corrige par des traducteurs (des etres humains, pas des logiciels), en utilisant une interface semblable a celle utilisee actuellement pour la correction du texte d'un livre (issu d'un logiciel OCR) par les volontaires de Distributed Proofreaders.

On se prend ainsi a rever a un Distributed Translators pour partager la revision des traductions, Distributed Translators pouvant etre un organisme partenaire de Distributed Proofreaders et du Projet Gutenberg.

DISTRIBUTED PROOFREADERS IS TEN YEARS OLD [EN]

Project Gutenberg got its first boost with the invention of the web in 1990, and its second boost with the creation of Distributed Proofreaders in 2000, to share the proofreading of digitized books between many volunteers. Volunteers choose a book currently processed through the site to proofread a given page, or several pages, as they wish. One page per day is a great goal. It doesn't seem much, but with hundreds of volunteers it really adds up.

# A website launched in 2000

Distributed Proofreaders (DP) was founded in October 2000 by Charles Franks to support the digitization of public domain books. From the website one can access a program that allows several proofreaders to be working on the same book at the same time, each proofreading on different pages. The goal is to all work together - from any region in the world - to significantly speed up the proofreading process.

Originally conceived to assist Project Gutenberg (PG), Distributed Proofreaders is now the main source of PG ebooks. In 2002, DP became an official PG site. In May 2006, DP became a separate legal entity and continues to maintain a strong relationship with PG.

Distributed Proofreaders counted 3,000 ebooks "preserved for the world" in February 2004, 5,000 ebooks in October 2004, 7,000 ebooks in May 2005, 10,000 ebooks in December 2006, 11,950 ebooks in January 2008, and 18,848 ebooks on 15 October 2010. Production was 196 titles in October 2010.

# How all this works

Volunteers register and receive detailed instructions. For example, words in bold, italic or underlined, or footnotes are always treated the same way for any ebook. A discussion forum allows them to ask questions or seek help at any time.

Each time proofreaders go to the website, they choose the book they want. One page of the book appears in two forms side by side: the scanned image of one page, and the text from that image as produced by OCR software. The proofreader can easily compare both versions, note the differences, and fix them. OCR is usually 99% accurate, which makes for about 10 corrections a page. The proofreader saves the page as it is completed, and then can either stop work or do another.

The books are proofread twice, and the second time only by experienced proofreaders.

All the pages of the book are then formatted, combined and assembled by post-processors to make an ebook.

A project manager oversees the progress of a particular book through its different steps on the website.

The ebook is now ready to be released in Project Gutenberg with an index entry (title, subtitle, author, ebook number, and character set) for the database. Catalogers go on with the cataloguing process (author's dates of birth and death, Library of Congress classification, etc.) after the release.

# Everyone is welcome

New volunteers are most welcome, and will be guided by experienced volunteers for their first steps. There is a lot to do, and everyone is welcome.

As stated on DP's website in 2005, "Remember that there is no commitment expected on this site. Proofread as often or as seldom as you like, and as many or as few pages as you like. We encourage people to do 'a page a day', but it's entirely up to you! We hope you will join us in our mission of 'preserving the literary history of the world in a freely available form for everyone to use'."

# Distributed Proofreaders Europe

Distributed Proofreaders Europe (DP Europe) was launched in early 2004
by Project Rastko in Belgrade, Serbia, as well as Project Gutenberg
Europe. DP Europe uses the software of the original Distributed
Proofreaders.

Since its beginning, DP Europe has been a multilingual website, with its main pages translated into the main national European languages by volunteer translators. DP Europe was available in 12 languages as early as April 2004. The long-term goal is 60 languages representing most European languages.

In May 2005, DP Europe finished processing its 100th ebook. Ebooks were in several languages to reflect European linguistic diversity. 600 ebooks were ready in February 2009, and 732 ebooks on 15 October 2010.

DP Europe supports Unicode to be able to proofread ebooks in numerous languages. Unicode is an encoding system created in 1991 that gives a unique number for every character in any language. Unicode is meant to replace ASCII, an encoding system dating back from 1968 that can only handle English and Latin in its "original" version, and a few European languages with accents in its "extended" version. In 2008, half of the files available on the internet were Unicode files.

# Distributed Proofreaders Canada

Distributed Proofreaders Canada (DPC) started production in December 2007, to digitize and proofread ebooks for Project Gutenberg Canada (PGC), founded on July 1st, 2007, on Canada Day, by Michael Shepard and David Jones. There were 100 ebooks in March 2008, in English, French and Italian. 250 ebooks were available in February 2009, and 427 books on October 15, 2010.

# A few numbers

= Over 33,000 high-quality proofread ebooks in Project Gutenberg, in several languages. (Quality more than quantity is what really matters to the reader, believe me.)

= 18,961 ebooks processed by Distributed Proofreaders (the original website) on November 1st, 2010, since its creation in October 2000, with 2,352 active volunteers in October 2010.

= 739 ebooks processed by Distributed Proofreaders Europe on November 1st, 2010, since its creation on January 2004.

= 433 ebooks processed by Distributed Proofreaders Canada on November 1st, 2010, since its creation in December 2007, with 127 active volunteers in October 2010.

# A few links

Project Gutenberg, https://www.gutenberg.org/ with 33,000 high-quality proofread ebooks.

Distributed Proofreaders, http://www.pgdp.net/c/ launched in October 2000.

Distributed Proofreaders Europe, http://dp.rastko.net/ launched in early 2004, with a plurilingual interface, and books to proofread in several languages.

Distributed Proofreaders Canada, http://www.pgdpcanada.net/c/default.php launched in December 2007.

Volunteers are most welcome on the three websites - with no geographic requirements - because there are no borders for beautiful literary works to be "preserved for the world".

DISTRIBUTED PROOFREADERS TIENE 10 ANOS [ES]

El Proyecto Gutenberg cobra nuevo aliento y alcanza una difusion internacional con la aparicion de la web en 1990, y luego con la creacion de Distributed Proofreaders (Correctores Distribuidos) en 2000, cuya meta es compartir la revision de los libros entre centenares de voluntarios. Los voluntarios eligen un libro digital que se esta procesando en el sitio para releer y corregir determinada pagina, o algunas paginas, como quieran. A titulo indicativo, se aconseja corregir una pagina al dia. Representa poco tiempo en un dia, pero mucho para el proyecto. Una pagina multiplicada por cientos de voluntarios representa un volumen considerable.

# Un sitio lanzado en 2000

Distributed Proofreaders es concebido en octubre de 2000 por Charles Franks para contribuir a la digitalizacion de los libros del dominio publico. La interfaz del sitio web da acceso a un software que permite a varios voluntarios trabajar simultaneamente en el mismo libro, cada uno corrigiendo diferentes paginas. El objetivo es que todos trabajen juntos - desde cualquier lugar del mundo - para acelerar significativamente el proceso de revision de los libros.

Originalmente destinado a ayudar el Proyecto Gutenberg en su tarea, Distributed Proofreaders se convierte rapidamente en la principal fuente de sus ebooks. Despues de afiliarse con el Proyecto Gutenberg en 2002, Distributed Proofreaders se convierte en una entidad independiente en mayo de 2006, aunque manteniendo una estrecha relacion con este.

Distributed Proofreaders contabiliza 3.000 libros digitalizados y corregidos en febrero de 2004, 5.000 libros en octubre de 2004, 7.000 libros en mayo de 2005, 10.000 libros en diciembre de 2006, 11.950 libros en enero de 2008 y 19.059 libros el 16 de noviembre de 2010. La produccion es de 196 ebooks en octubre de 2010.

# La organizacion practica del procesamiento

El nuevo voluntario empieza por registrarse. Recibe instrucciones detalladas, por ejemplo como tratar las partes en negrita, en cursiva o subrayadas, o las notas, que se tratan todas de la misma manera. Un foro permite formular preguntas y pedir ayuda en cualquier momento.

Cuando el voluntario inicia una sesion en el sitio, elige un libro a partir de una lista dada. Una pagina del libro elegido aparece en dos versiones: por una parte la imagen digitalizada de la pagina, por otra el texto resultante de esta imagen, producido por un software de OCR (reconocimiento optico de caracteres). El voluntario compara las dos versiones y corrige las diferencias. Un software de OCR tiene una precision del 99%, lo que representa un promedio de diez errores a corregir por pagina. Luego el voluntario salva la pagina y puede cesar su relectura o bien optar por la correccion de otra pagina.

Todos los libros son revisados dos veces, y la segunda vez solo por correctores experimentados.

Otros voluntarios llamados "post-procesadores" ("post-processors" en ingles) formatean y montan las paginas corregidas, de acuerdo con normas precisas, para obtener un ebook.

Durante todo el proceso, un jefe de proyecto (llamado "project manager" en ingles) sigue el tratamiento de un libro dado para garantizar el buen funcionamiento del proceso.

A continuacion se pone en linea el ebook en el Proyecto Gutenberg despues de su indexacion (titulo, subtitulo, autor, numero del ebook y formato de codificacion) por voluntarios indizadores. Catalogadores voluntarios se encargan luego de la catalogacion de este libro (fechas de nacimiento y muerte del autor, clasificacion de la Biblioteca del Congreso, etc.).

# Calquier participacion es bienvenida

Los nuevos voluntarios son bienvenidos, en cualquier pais y para cualquier idioma, y seran guiados por voluntarios experimentados para sus primeros pasos como revisores. La tarea es inmensa, y cualquier ayuda es muy apreciada.

Como se indica en el sitio web en 2005, "DP no espera su compromiso incondicional. Usted puede revisar textos todas las veces que quiera, y el numero de paginas que desee. Alentamos a la gente a corregir una pagina por dia, pero usted esta totalmente libre de hacer lo que le gusta. Esperamos que usted se una a nuestra mision de 'preservar la literatura mundial en una version gratuita y disponible para todos'."

# Distributed Proofreaders Europa

Distributed Proofreaders Europa (DP Europa) - copiado a partir del sitio y del software original de Distributed Proofreaders - se lanza en enero de 2004 para gestionar la revision de los libros del Proyecto Gutenberg Europa, a iniciativa del Proyecto Rastko, basado en Belgrado (Serbia).

Desde sus inicios, DP Europa es un sitio web multilinguee, traducido por voluntarios a los grandes idiomas nacionales europeos, y disponible en doce idiomas en abril de 2004. El objetivo a largo plazo es una interfaz en sesenta idiomas para tener en cuenta todas las (mayores) lenguas europeas.

Los cien primeros libros estan disponibles en abril de 2005. Estos libros estan en varios idiomas - de los cuales el espanol - con el fin de reflejar la diversidad lingueistica que prevalece en Europa. DP Europa contabiliza 600 libros en febrero de 2009, y 741 libros el 16 de noviembre de 2010.

DP Europa utiliza el Unicode para poder procesar libros en varios idiomas. Unicode es un sistema de codificacion creado en 1991, que asigna un codigo unico para cada caracter de todos los idiomas del planeta. Se sustituye poco a poco al ASCII, un sistema de codificacion que data de 1968 y que solo puede procesar el ingles y el latin en su version "original", y algunos idiomas europeos con acentos en su version "extendida". En 2008, 50% de los archivos disponibles en el internet estan codificados en Unicode.

# Distributed Proofreaders Canada

Distributed Proofreaders Canada (PGC) se lanza en diciembre de 2007 para la produccion de los ebooks del Proyecto Gutenberg Canada (PGC), creado el 1 de julio de 2007, dia de la fiesta nacional, a instigacion de Michael Shepard y David Jones. Los cien primeros libros estan disponibles en marzo de 2008, con libros en ingles, en frances y en italiano. 250 libros estan disponibles en febrero de 2009, y 441 libros el 16 de noviembre de 2010.

# Algunas cifras

= Mas de 33.000 ebooks en el Proyecto Gutenberg, todos revisados dos veces, y en varios idiomas. El objetivo es mas la calidad que la cantidad.

= 19.059 ebooks procesados por Distributed Proofreaders (el sitio original, basado en los Estados Unidos) el 16 de noviembre de 2010, desde su lanzamiento en octubre de 2000, y 2.352 voluntarios activos durante el mes de octubre de 2010.

= 741 ebooks procesados por Distributed Proofreaders Europa el 16 de noviembre de 2010, desde su lanzamiento en enero de 2004.

= 441 ebooks procesados por Distributed Proofreaders Canada el 16 de noviembre de 2010, desde su lanzamiento en diciembre de 2007, con 127 voluntarios activos durante el mes de octubre de 2010.

# Algunos enlaces

El Proyecto Gutenberg, https://www.gutenberg.org/

Distributed Proofreaders, http://www.pgdp.net/c/ que tiene 10 anos.

Distributed Proofreaders Europa, http://dp.rastko.net/ el proyecto europeo lanzado en enero de 2004, con una interfaz en varios idiomas, incluso en espanol.

Distributed Proofreaders Canada, http://www.pgdpcanada.net/c/default.php lanzado en diciembre de 2007.

Los voluntarios de todos los paises son bienvenidos en los tres sitios - sin preferencia geografica o lingueistica - porque la buena literatura no tiene fronteras.

DISTRIBUTED PROOFREADERS A DIX ANS [FR]

Le Projet Gutenberg trouve un second souffle et un rayonnement international avec l'apparition du web en 1990 puis la creation de Distributed Proofreaders en 2000, pour partager la relecture des livres entre des centaines de volontaires. Les volontaires choisissent un livre en cours de traitement pour relire et corriger une page donnee, ou bien plusieurs. A titre indicatif, il est conseille de relire une page par jour. C'est peu de temps sur une journee, et c'est beaucoup pour le projet. Une page multipliee par des centaines de volontaires represente un chiffre considerable.

# Un site lance en 2000

Distributed Proofreaders est concu en octobre 2000 par Charles Franks pour contribuer a la numerisation des livres du domaine public. A partir du site web, on accede a un logiciel permettant a plusieurs correcteurs de travailler simultanement au meme livre, chacun travaillant sur des pages differentes, le but etant bien sur de travailler ensemble - de n'importe quelle region du monde - pour accelerer de maniere sensible le processus de revision des livres.

Cense a l'origine aider le Projet Gutenberg dans sa tache, Distributed Proofreaders devient rapidement la principale source des livres du Projet Gutenberg. Apres avoir ete affilie au Projet Gutenberg en 2002, il devient une entite independante en mai 2006, tout en conservant des liens etroits avec le Projet Gutenberg.

Distributed Proofreaders comptabilise 3.000 livres numerises et corriges en fevrier 2004, 5.000 livres en octobre 2004, 7.000 livres en mai 2005, 10.000 livres en decembre 2006, 11.950 livres en janvier 2008 et 18.848 livres le 15 octobre 2010. La production etait de 196 livres en octobre 2010.

# Comment cela se passe, pratiquement

Le volontaire relecteur commence par s'inscrire. Il recoit des directives detaillees. Ces directives concernent par exemple les parties en gras, en italique et soulignees, ou les notes, qui sont toutes traitees de la meme maniere. Un forum permet de poser des questions et de demander de l'aide a tout moment.

Quand le relecteur se connecte au site, il selectionne le livre de son choix a partir d'une liste donnee. Une page du livre choisi apparait simultanement dans deux versions: d'une part l'image scannee, d'autre part le texte issu de cette image, produit par un logiciel OCR. Le relecteur compare les deux versions et corrige les differences. Un logiciel OCR etant fiable a 99%, cela represente une moyenne de dix erreurs a corriger par page. Le relecteur sauvegarde ensuite la page, et peut ensuite soit cesser le travail, soit opter pour la correction d'une autre page.

Tous les livres sont relus et corriges deux fois de suite et, la deuxieme fois, uniquement par des correcteurs experimentes.

Les pages corrigees sont ensuite formatees et assemblees selon des regles precises par d'autres volontaires (appeles "post-processors") pour obtenir un ebook.

Durant la totalite du processus, le traitement d'un livre donne est suivi par un responsable (appele "project manager"), qui s'assure du bon deroulement des operations.

Apres la mise en forme suit la mise en ligne sur le Projet Gutenberg, avec indexation du livre (titre, sous-titre, auteur, numero de l'ebook et format d'encodage) par d'autres volontaires puis catalogage complementaire (dates de naissance et mort de l'auteur, classification de la Library of Congress, etc.) ensuite.

# Toute participation est bienvenue

De nouveaux volontaires sont bienvenus, dans tout pays et pour toute langue, y compris pour les livres en francais, et seront guides par des volontaires experimentes pour leurs premiers pas en tant que reviseurs. La tache est immense, et toute aide est tres appreciee.

Comme indique sur le site en 2005, "DP ne s'attend pas a un engagement inconditionnel de votre part. Corrigez des textes aussi souvent que vous le voulez, et le nombre de pages que vous voulez. Nous encourageons les gens a corriger une page par jour, mais vous etes tout a fait libre de faire ce qui vous plait. Nous esperons que vous vous joindrez a notre mission de "preserver la litterature mondiale dans une version gratuite et disponible pour tous"."

# Distributed Proofreaders Europe

Distributed Proofreaders Europe (DP Europe) - calque sur le site original de Distributed Proofreaders, dont il utilise le logiciel - est lance en janvier 2004 pour gerer la relecture partagee du Projet Gutenberg Europe, sous l'egide du Projet Rastko a Belgrade (Serbie).

Des ses debuts, DP Europe est un site multilingue. Ses pages principales sont traduites dans les grandes langues nationales europeennes par des traducteurs volontaires. Le site de DP Europe est disponible en douze langues des le mois d'avril 2004. L'objectif a long terme est soixante langues, avec prise en compte de la plupart des langues europeennes.

Cent livres numerises et corriges sont disponibles en mai 2005. Les livres sont en plusieurs langues pour refleter la diversite linguistique prevalant en Europe. 600 livres sont prets en fevrier 2009 et 732 livres le 15 octobre 2010.