The Project Gutenberg eBook of 40 years / 40 años / 40 ans
Title: 40 years / 40 años / 40 ans
Author: Marie Lebert
Release date: December 23, 2010 [eBook #34731]
Language: English, Spanish, French
Credits: Produced by Al Haines
Produced by Al Haines
40 YEARS / 40 ANOS / 40 ANS
MARIE LEBERT
Copyright (C) 2010 Marie Lebert
—- A trilingual ebook to celebrate the 40 years (1971-2011) of Project Gutenberg, born on July 4, 1971, with celebrations during the whole year 2011.
—- Un ebook trilinguee para celebrar los 40 anos (1971-2011) del Proyecto Gutenberg, nacido el 4 de julio de 1971, con celebraciones durante todo el ano 2011.
—- Un ebook trilingue pour celebrer les 40 ans (1971-2011) du Projet Gutenberg, ne le 4 juillet 1971, avec des celebrations pendant toute l'annee 2011.
—-
TABLE OF CONTENTS / INDICE / TABLE
[en] Overview [es] Sumario [fr] Sommaire
[en] Project Gutenberg is 40 years old [es] El Proyecto Gutenberg tiene 40 anos [fr] Le Projet Gutenberg a 40 ans
[en] From the past to the future [es] Desde el pasado hacia el futuro [fr] Du passe vers l'avenir
[en] Project Gutenberg and languages [es] El Proyecto Gutenberg y los idiomas [fr] Le Projet Gutenberg et les langues
[en] Distributed Proofreaders is 10 years old [es] Distributed Proofreaders tiene 10 anos [fr] Distributed Proofreaders a 10 ans
[en] Acknowledgements [es] Agradecimientos [fr] Remerciements
OVERVIEW [EN]
The first ebook was available on July 4, 1971, as eText #1 of Project Gutenberg, a visionary project launched by Michael Hart to create free electronic versions of literary works and disseminate them worldwide. In the 16th century, Gutenberg allowed anyone to have print books for a small cost. In the 21st century, Project Gutenberg would allow anyone to have a digital library at no cost. Project Gutenberg got its first boost with the invention of the web in 1990, and its second boost with the creation of Distributed Proofreaders in 2000, to share the proofreading of ebooks between hundreds of volunteers. In 2010, Project Gutenberg offered more than 33,000 high-quality ebooks being downloaded by the tens of thousands every day, and websites in the United States, in Australia, in Europe, and in Canada, with 40 mirror sites worldwide.
This trilingual (English, Spanish, French) ebook is meant to celebrate the 40th anniversary of Project Gutenberg, with four parts: # Project Gutenberg is 40 years old # From the past to the future # Project Gutenberg and languages # Distributed Proofreaders is 10 years old
About the author > Marie Lebert is a researcher and journalist specializing in technology for books and languages. Her books are freely available in Project Gutenberg <www.gutenberg.org> and in ManyBooks.net <http://manybooks.net>, in various formats for any electronic device (computer, PDA, mobile phone, smartphone, ebook reader).
SUMARIO [ES]
El primer libro digital remonta al 4 de julio de 1971. Se trata del eText #1 del Proyecto Gutenberg, un proyecto visionario lanzado por Michael Hart con el fin de crear versiones electronicas gratuitas de obras literarias y de difundirlas por el mundo entero. En el siglo 16, Gutenberg habia hecho posible para todos tener libros impresos por un precio relativamente modico. En el siglo 21, el Proyecto Gutenberg iba a permitir a cada uno disponer de una biblioteca digital gratuita. Este proyecto cobra nuevo aliento y alcanzo una difusion internacional con la aparicion de la web en 1990, y luego con la creacion de Distributed Proofreaders en 2000, cuya meta es compartir la revision de los libros entre centenares de voluntarios. En 2010, el Proyecto Gutenberg cuenta con mas de 33.000 ebooks de alta calidad y decenas de milles de descargas al dia. Tiene sitios web en los Estados Unidos, en Australia, en Europa y en Canada, con 40 sitios espejo repartidos por todo el planeta.
Este ebook trilinguee (ingles, espanol, frances) tiene como meta celebrar los 40 anos del Proyecto Gutenberg, con quatro partes: # El Proyecto Gutenberg tiene 40 anos # Desde el pasado hacia el futuro # El Proyecto Gutenberg y los idiomas # Distributed Proofreaders tiene 10 anos
Sobre la autora > Marie Lebert, investigadora y periodista, se interesa por las tecnologias para el libro y los idiomas. Sus libros estan disponibles gratuitamente en el Proyecto Gutenberg <www.gutenberg.org> y en ManyBooks.net <http://manybooks.net>, en varios formatos para lectura en un ordenador, un PDA, un telefono movil, un smartphone o una tableta. Muchas gracias a Anna Alvarez por su ayuda para varios textos en espanol.
SOMMAIRE [FR]
Le premier livre numerique date du 4 juillet 1971. Il s'agit de l'eText #1 du Projet Gutenberg, un projet visionnaire lance par Michael Hart pour creer des versions electroniques gratuites d'oeuvres litteraires et les diffuser dans le monde entier. Au 16e siecle, Gutenberg avait permis a chacun d'avoir des livres imprimes pour un prix relativement modique. Au 21e siecle, le Projet Gutenberg permettrait a chacun d'avoir une bibliotheque numerique gratuite. Ce projet trouve un second souffle et un rayonnement international avec l'apparition du web en 1990, puis la creation de Distributed Proofreaders en 2000 pour partager la relecture des livres entre des centaines de volontaires. En 2010, le Projet Gutenberg compte plus de 33.000 ebooks de grande qualite ainsi que des dizaines de milliers de telechargements par jour. Il dispose de sites web aux Etats-Unis, en Australie, en Europe et au Canada, avec 40 sites miroirs repartis sur toute la planete.
Cet ebook trilingue (anglais, espagnol, francais) a pour but de celebrer les 40 ans du Projet Gutenberg, avec quatre parties: # Le Projet Gutenberg a 40 ans # Du passe vers l'avenir # Le Projet Gutenberg et les langues # Distributed Proofreaders a 10 ans
Au sujet de l'auteure > Marie Lebert, chercheuse et journaliste, s'interesse aux technologies pour le livre et les langues. Ses livres sont librement disponibles dans le Projet Gutenberg <www.gutenberg.org> et dans ManyBooks.net <http://manybooks.net>, dans divers formats permettant leur lecture sur tout appareil electronique (ordinateur, PDA, telephone mobile, smartphone et tablette).
PROJECT GUTENBERG IS 40 YEARS OLD [EN]
In the 16th century, Gutenberg allowed anyone to have print books for a small cost. In the 21st century, Project Gutenberg would allow anyone to have a digital library at no cost.
# Beginning
As recalled by Michael Hart in January 2009 in an email interview: "On July 4, 1971, while still a freshman at the University of Illinois (UI), I decided to spend the night at the Xerox Sigma V mainframe at the UI Materials Research Lab, rather than walk miles home in the summer heat, only to come back hours later to start another day of school. I stopped on the way to do a little grocery shopping to get through the night, and day, and along with the groceries they put in the faux parchment copy of The U.S. Declaration of Independence that became quite literally the cornerstone of Project Gutenberg. That night, as it turned out, I received my first computer account - I had been hitchhiking on my brother's best friend's name, who ran the computer on the night shift. When I got a first look at the huge amount of computer money I was given, I decided I had to do something extremely worthwhile to do justice to what I had been given. This was such a serious, and intense thought process for a college freshman, my first thought was that I had better eat something to get up enough energy to think of something worthwhile enough to repay the cost of all that computer time. As I emptied out groceries, the faux parchment Declaration of Independence fell out, and the light literally went on over my head like in the cartoons and comics… I knew what the future of computing, and the internet, was going to be… 'The Information Age.' The rest, as they say, is history."
Michael keyed in The United States Declaration of Independence to the mainframe he was using, in upper case, because there was no lower case yet. The file was 5 K. To send a 5 K file to the 100 users of the pre- internet of the time would have crashed the network, so Michael mentioned where the etext was stored - though without a hypertext link, because the web was still 20 years ahead. It was downloaded by six users. Project Gutenberg was born.
Michael decided to use the huge amount of computer time he had been given to search the literary works that were stored in libraries, and to digitize these works. A book would become a continuous text file instead of a set of pages. Project Gutenberg's mission would be the following: to put at everyone's disposal, in electronic versions, as many literary works as possible for free.
After keying in The United States Declaration of Independence (signed on July 4, 1776) in 1971, Michael typed in a longer text, The United States Bill of Rights, in 1972, i.e. the first ten amendments added in 1789 to the Constitution (dated 1787) and defining the individual rights of the citizens and the distinct powers of the federal government and the States. A volunteer typed in The United States Constitution in 1973.
From one year to the next, disk space was getting larger, by the standards of the time - there was no hard disk yet -, making it possible to store larger files.
Volunteers began typing in The Bible, with one individual book at a time, and a file for each book.
Michael typed in the collected works of Shakespeare, with volunteers, one play at a time, and a file for each play. This edition of Shakespeare was never released, unfortunately, due to changes in copyright law. Shakespeare's works belong to public domain, but comments and notes may be copyrighted, depending on the publication date. Other editions of Shakespeare from public domain were released a few years later.
# 10 to 1,000 ebooks
Its critics long considered Project Gutenberg as impossible on a large scale. But Michael went on keying book after book during many years, with the help of some volunteers.
In August 1989, Project Gutenberg completed its 10th ebook, The King James Bible (1769), both testaments, and 5M for all files.
In 1990, there were 250,000 internet users. The web was in its infancy.
The standard was 360 K disks.
In January 1991, Michael typed in Alice's Adventures in Wonderland (1865), by Lewis Carroll. In July 1991, he typed in Peter Pan (1904), by James M. Barrie. These two classics of childhood literature each fit on one disk.
The first browser, Mosaic, was released in November 1993. It became easier to circulate etexts and recruit volunteers. From 1991 to 1996, the number of ebooks doubled every year, with one ebook per month in 1991, two ebooks per month in 1992, four ebooks per month in 1993, and eight ebooks per month in 1994.
In January 1994, Project Gutenberg released The Complete Works of William Shakespeare as eBook #100. Shakespeare wrote most of his works between 1590 and 1613.
The steady growth went on, with an average of 8 ebooks per month in 1994, 16 ebooks per month in 1995, and 32 ebooks per month in 1996.
In June 1997, Project Gutenberg released The Merry Adventures of Robin
Hood (1883), by Howard Pyle.
Project Gutenberg reached 1,000 ebooks in August 1997. EBook #1000 was La Divina Commedia (1321), by Dante Alighieri, in Italian, its original language.
With the number of ebooks on the rise, three main sections were set up: (a) "Light Literature", such as Alice's Adventures in Wonderland, Through the Looking-Glass, Peter Pan and Aesop's Fables; (b) "Heavy Literature", such as the Bible, Shakespeare's works, Moby Dick and Paradise Lost; (c) "Reference Literature", such as Roget's Thesaurus, almanacs, and a set of encyclopedias and dictionaries. (A more detailed classification was created later on.)
"Light Literature" was the main section in number of ebooks. As explained on the website in 1998: "The Light Literature Collection is designed to get persons to the computer in the first place, whether the person may be a pre-schooler or a great-grandparent. We love it when we hear about kids or grandparents taking each other to an etext of Peter Pan when they come back from watching Hook at the movies, or when they read Alice in Wonderland after seeing it on TV. We have also been told that nearly every Star Trek movie has quoted current Project Gutenberg etext releases (from Moby Dick in The Wrath of Khan; a Peter Pan quote finishing up the most recent, etc.) not to mention a reference to Through the Looking-Glass in JFK. This was a primary concern when we chose the books for our libraries. We want people to be able to look up quotations they heard in conversation, movies, music, other books, easily with a library containing all these quotations in an easy-to- find etext format."
Project Gutenberg's goal is more about selecting books intended for the general public than providing authoritative editions. As explained on the website in 1998: "We do not write for the reader who cares whether a certain phrase in Shakespeare has a ':' or a ';' between its clauses. We put our sights on a goal to release etexts that are 99.9% accurate in the eyes of the general reader. Given the preferences our proofreaders have, and the general lack of reading ability the public is currently reported to have, we probably exceed those requirements by a significant amount. However, for the person who wants an 'authoritative edition' we will have to wait some time until this becomes more feasible. We do, however, intend to release many editions of Shakespeare and the other classics for comparative study on a scholarly level."
The etexts, later called ebooks, were stored in the simplest way, using the low set of ASCII, called Plain Vanilla ASCII, for them to be read on any hardware and software. As a text file, a book could be easily copied, indexed, searched, analyzed, and compared with other books.
As explained by Michael Hart in August 1998 in an email interview: "We consider etext to be a new medium, with no real relationship to paper, other than presenting the same material, but I don't see how paper can possibly compete once people each find their own comfortable way to etexts, especially in schools. (…) My own personal goal is to put 10,000 etexts on the net [this goal was reached in October 2003] and if I can get some major support, I would like to expand that to 1,000,000 and to also expand our potential audience for the average etext from 1.x% of the world population to over 10%, thus changing our goal from giving away 1,000,000,000,000 etexts to 1,000 times as many, a trillion and a quadrillion in U.S. terminology."
# 1,000 to 10,000 ebooks
From 1998 to 2000, the "output" was an average of 36 new ebooks per month.
Project Gutenberg reached 2,000 ebooks in May 1999. EBook #2000 was Don Quijote (1605), by Cervantes, in Spanish, its original language.
Distributed Proofreaders was launched in October 2000 by Charles Franks to share the proofreading of ebooks between many volunteers. Volunteers choose one of the digitized books available on the website and proofread a given page, or several pages, as they wish.
Project Gutenberg reached 3,000 ebooks in December 2000. EBook #3000 was A l'ombre des jeunes filles en fleurs (In the Shadow of Young Girls in Flower), vol. 3 (1919), by Marcel Proust, in French, its original language.
Project Gutenberg Australia was launched in August 2001.
Project Gutenberg reached 4,000 ebooks in October 2001. EBook #4000 was The French Immortals Series (1905), in English. This book is an anthology of short fictions by authors from the French Academy (Academie Francaise): Emile Souvestre, Pierre Loti, Hector Malot, Charles de Bernard, Alphonse Daudet, and others.
The output in 2001 was an average of 104 new ebooks per month.
Project Gutenberg reached 5,000 ebooks in April 2002. EBook #5000 was The Notebooks of Leonardo da Vinci, an English version of Leonardo's early 16th-century writings in Italian. Since its release, this ebook has constantly stayed in the Top 100 of downloaded ebooks.
In 1991, Michael Hart chose to type in Alice's Adventures in Wonderland and Peter Pan because they would each fit on one 360 K disk, the standard of the time. In 2002, the standard disk was 1.44 M and could be compressed as a zipped file.
A practical file size is about 3 million characters, more than long enough for the average book. The ASCII version of a 300-page novel is 1 M. A bulky book can fit in two ASCII files, that can be downloaded as is or zipped. An average of 50 hours is necessary to get an ebook selected, copyright-cleared, scanned, proofread, formatted, and assembled.
A few numbers are reserved for "special" books. For example, eBook #1984 is reserved for George Orwell's classic, published in 1949, and still a long way from falling into public domain.
In spring 2002, Project Gutenberg's ebooks represented 25% of all the public domain works freely available on the web and listed in the Internet Public Library (IPL). The output in 2002 was an average of 203 new ebooks per month.
In November 2002, Project Gutenberg released the 75 files of the Human Genome Project, with files of dozens or hundreds of megabytes, shortly after its initial release in February 2001 as a work from public domain.
1,000 ebooks in August 1997, 2,000 ebooks in May 1999, 3,000 ebooks in December 2000, 4,000 ebooks in October 2001, 5,000 ebooks in April 2002, 10,000 ebooks in October 2003. EBook #10000 was The Magna Carta, signed in 1215 and known as the first English constitutional text.
From April 2002 to October 2003, in 18 months, the collection of ebooks doubled, going from 5,000 ebooks to 10,000 ebooks, with a monthly average of 348 new ebooks in 2003. The fast growth was the work of Distributed Proofreaders, a website launched in October 2000 to share the proofreading of ebooks between many volunteers.
EBooks were also copied on CDs and DVDs. As blank CDs and DVDs cost next to nothing, Project Gutenberg began burning and sending a free CD or DVD to anyone asking for it. People were encouraged to make copies for a friend, a library or a school. Released in August 2003, the Best of Gutenberg CD contained 600 ebooks. The first Project Gutenberg DVD was released in December 2003 to celebrate the first 10,000 ebooks, with the burning of most titles (9,400 ebooks).
In September 2003, Project Gutenberg launched Project Gutenberg Audio
eBooks, a collection of human-read ebooks, as well as the Sheet Music
Subproject, a collection of digitized music sheet and music recordings.
A collection of still and moving pictures was also available.
# 10,000 to 20,000 ebooks
In December 2003, there were 11,000 ebooks, which represented 110 G, in several formats (ASCII, HTML, PDF, and others, as is or zipped). In May 2004, there were 12,600 ebooks, which represented 135 G. With more than 300 new ebooks added per month (338 ebooks per month in 2004), the number of gigabytes was expected to double every year.
The Project Gutenberg Consortia Center (PGCC) was affiliated with Project Gutenberg in 2003, and became an official Project Gutenberg site. Since 1997, PGCC had been working on gathering collections of existing ebooks, as a complement to Project Gutenberg working on producing ebooks. As explained by Michael Hart in February 2009: "The Project Gutenberg Consortia Center has over 75,000 ebooks rendered as PDF files, and some are really quite stunning. The difference? These files were prepared by other eLibraries, not Project Gutenberg, and are using our worldwide distribution network to be seen."
In Europe, Project Rastko, based in Belgrade, Serbia, launched Project
Gutenberg Europe (PG Europe) and Distributed Proofreaders Europe (DP
Europe) in January 2004. 100 ebooks were available in June 2005, in
several languages, as a reflection of European linguistic diversity.
In January 2005, Project Gutenberg reached 15,000 ebooks. EBook #15000 was The Life of Reason (1906), by George Santayana.
What about languages? There were ebooks in 25 languages in February 2004, and in 42 languages in July 2005, including Sanskrit and the Mayan languages. The seven main languages - with more than 50 ebooks - were English (with 14,548 ebooks on July 27, 2005), French (577 ebooks), German (349 ebooks), Finnish (218 ebooks), Dutch (130 ebooks), Spanish (103 ebooks), and Chinese (69 ebooks).
In July 2005, Project Gutenberg Australia (launched in August 2001) reached 500 ebooks.
Project Gutenberg PrePrints was launched in January 2006 to collect items submitted to Project Gutenberg which were interesting enough to be available online, but not ready yet to be added to the main Project Gutenberg collection, because of missing data, low-quality files, formats which were not handy, etc. 379 ebooks were available in December 2006, and 2,020 ebooks in February 2009.
In December 2006, Project Gutenberg reached 20,000 ebooks. EBook #20000 was the audiobook of Twenty Thousand Leagues Under the Sea (Vingt mille lieues sous les mers, 1869), by Jules Verne, in its English version.
If 32 years and 3 months, from July 1971 to October 2003, were necessary to produce the first 10,000 ebooks, 3 years and 2 months, from October 2003 to December 2006, were necessary to produce the following 10,000 ebooks. There were ebooks in 50 languages in December 2006.
# 20,000 to 30,000 ebooks
In December 2006, Mike Cook launched the blog Project Gutenberg News as "the news portal for gutenberg.org", to complement the existing weekly and monthly newsletters. For example, the blog gave a table of the weekly, monthly and yearly production numbers since 2001.
The weekly production was 24 ebooks in 2001, 47 ebooks in 2002, 79 ebooks in 2003, 78 ebooks in 2004, 58 ebooks in 2005, and 80 ebooks in 2006.
The monthly production was 104 ebooks in 2001, 203 ebooks in 2002, 348 ebooks in 2003, 338 ebooks in 2004, 252 ebooks in 2005, and 345 ebooks in 2006.
The yearly production was 1,244 ebooks in 2001, 2,432 ebooks in 2002, 4,176 ebooks in 2003, 4,058 ebooks in 2004, 3,019 ebooks in 2005, and 4,141 ebooks in 2006.
Project Gutenberg Australia reached 1,500 ebooks in April 2007.
Project Gutenberg Canada (PGC) was launched on July 1st, 2007, on
Canada Day, by Michael Shepard and David Jones. Distributed
Proofreaders Canada (DPC) started production in December 2007. There
were 100 ebooks in March 2008, in English, French, and Italian.
Project Gutenberg sent out 15 million ebooks via CDs and DVDs by snail mail in 2007. The latest DVD (released in July 2006) included 17,000 ebooks. CD and DVD files were also generated as ISO files (since 2005) to be downloaded for burning CDs or DVDs.
Project Gutenberg reached 25,000 books in April 2008. EBook #25000 was English Book Collectors (1902), by William Younger Fletcher.
Project Gutenberg reached 30,000 books in October 2009. EBook #30000 was The Bird Book (1915), by Chester Albert Reed.
# 30,000 ebooks onwards
Distributed Proofreaders celebrated its 10th anniversary in October 2010, with more than 18,000 books digitized and proofread during ten years by thousands of volunteeers.
Project Gutenberg offered more than 33,000 high-quality proofread ebooks in December 2010, in various formats for any electronic device (computer, PDA, mobile phone, smartphone, and ebook reader).
EL PROYECTO GUTENBERG TIENE 40 ANOS [ES]
En el siglo 16, Gutenberg habia hecho posible para todos tener libros impresos por un precio relativamente modico. En el siglo 21, el Proyecto Gutenberg iba a permitir a cada uno disponer de una biblioteca digital gratuita.
# Gestacion
?Cuales son las raices del proyecto? Cuando Michael Hart estudia en la Universidad de Illinois (Estados Unidos), el laboratorio informatico de su universidad le asigna millones de dolares de tiempo de ordenador.
El 4 de julio de 1971, dia de la fiesta nacional, Michael digita The United States Declaration of Independence (Declaracion de independencia de los Estados Unidos), en mayusculas, pues las letras minusculas aun no existan. El texto electronico representa 5 K (kilobytes).
El envio de un archivo de 5 K a las cien personas que forman el pre- internet de la epoca haya acabado con el sistema, provocando su implosion, porque el ancho de banda aun es infimo.
Michael difunde un mensaje que explica donde se almacena el texto - aun sin enlace hipertexto, pues habria que esperar unos 20 anos mas para la web - y seis personas descargan este archivo.
Sobre la marcha, Michael decide dedicar ese enorme credito de tiempo a la busqueda de obras literarias disponibles en bibliotecas, y a la digitalizacion de estas. El conjunto de paginas encuadernadas, forma tradicional del libro, iba a convertirse en un texto electronico que se puede desplegar de par en par.
Poco despues, Michael define asi la mision del Proyecto Gutenberg: poner a disposicion de todos, por via electronica, el mayor numero posible de obras literarias gratuitamente.
Tras haber digitado The United States Declaration of Independence (Declaracion de independencia de los Estados Unidos, firmada el 4 de julio de 1776) en 1971, Michael prosigue con sus esfuerzos en 1972 digitando The United States Bill of Rights (Declaracion de derechos de los Estados Unidos). Esa declaracion incluye las diez primeras enmiendas anadidas en 1789 a la Constitucion de los Estados Unidos (ratificada en 1787), y define los derechos individuales de los ciudadanos y los poderes respectivos del gobierno federal y de los Estados. En 1973, un voluntario digita The United States Constitution (Constitucion de los Estados Unidos) en su totalidad.
El internet, aun embrionario en 1971, despega verdaderamente en 1974, tras la creacion del protocolo TCP/IP (Transmission Control Protocol / Internet Protocol).
Ano tras ano, la capacidad del disquete aumenta con regularidad - el disco duro no existe aun - de modo que los archivos pueden ocupar cada vez mas espacio. Algunos voluntarios se animan a digitalizar La Biblia, compuesta de varios libros, cada cual puede tratarse por separado y ocupar un archivo diferente.
Michael tambien empieza a digitar la obra completa de Shakespeare, con la ayuda de voluntarios, una obra de teatro tras otra, cada una en un archivo. De hecho aquella edicion nunca se puede poner en linea, debido a que, entre tanto, entra en vigor una ley de copyright mas rigurosa, ya no destinada a proteger el texto de Shakespeare, pasado desde hace tiempo al dominio publico, sino los comentarios y notas de aquella edicion. Otras ediciones anotadas que si han pasado al dominio publico se ponen en linea algunos anos mas tarde.
# De 10 a 1.000 ebooks
En agosto de 1989, el Proyecto Gutenberg pone en linea su decimo texto, The King James Bible, una biblia publicada por primera vez en 1611 y cuya version mas conocida es la de 1769. El conjunto de los archivos del Antiguo Testamento y del Nuevo Testamento representa 5 M (megabytes).
En 1990, ya hay 250.000 internautas, y el modelo estandar vigente es el disquete de 360 K (kilobytes).
En enero de 1991, Michael digita Alice's Adventures in Wonderland (Alicia en el pais de las maravillas, 1865) de Lewis Carroll. En julio del mismo ano, digita Peter Pan (1904) de James M. Barrie. Cada uno de estos dos clasicos de la literatura infantil cabe en un disquete estandar.
Luego llega la web, operativa a partir de 1991. El primer navegador, Mosaic, aparece en noviembre de 1993. Al generalizarse el acceso a la red, resulta mas facil hacer circular los textos electronicos y reclutar voluntarios.
El Proyecto Gutenberg perfecciona su metodo de trabajo, y logra digitalizar un texto al mes en 1991, dos textos al mes en 1992, cuatro textos al mes en 1993 y ocho textos al mes en 1994.
En enero de 1994, el Proyecto Gutenberg celebra su eBook #100 con la puesta en linea de The Complete Works of William Shakespeare (La obra completa de William Shakespeare). Shakespeare escribio la mayor parte de su obra entre 1590 y 1613.
A continuacion la produccion sigue aumentando, con una media de 8 ebooks al mes en 1994, 16 ebooks al mes en 1995 y 32 ebooks al mes en 1996.
Entre 1991 y 1996, la produccion se ha duplicado cada ano. Mientras sigue con la digitalizacion de los libros, Michael coordina tambien a partir de entonces el trabajo de decenas de voluntarios.
En 1997, la produccion sigue siendo de 32 ebooks al mes. En junio de 1997, el Proyecto Gutenberg pone en linea The Merry Adventures of Robin Hood (Las alegres aventuras de Robin Hood, 1883) de Howard Pyle. En agosto de 1997, se pone en linea el eBook #1000, La Divina Commedia (La Divina Comedia, 1321) de Dante Alighieri, en su idioma original, el italiano.
El Proyecto Gutenberg se articula en torno a tres grandes sectores: (a) "Light Literature"(literatura de entretenimiento), que incluye por ejemplo Alice's Adventures in Wonderland (Las aventuras de Alicia en el pais de las maravillas), Peter Pan o Aesop's Fables (Las Fabulas de Esopo); (b) "Heavy Literature" (literatura "seria"), que incluye por ejemplo La Biblia, las obras de Shakespeare o Moby Dick; (c) "Reference Literature" (literatura de referencia), que reune enciclopedias y diccionarios, por ejemplo el Roget's Thesaurus. Mas adelante, esta presentacion en tres sectores es sustituida por una clasificacion detallada con mas secciones.
El Proyecto Gutenberg pretende ser universal, tanto a nivel de las obras que selecciona como del publico al que se dirige, ya que la meta es poner la literatura a disposicion de todos, sin limitarse al publico habitual de estudiantes y docentes.
El sector dedicado a la literatura de entretenimiento se propone atraer frente a la pantalla a un publico muy diverso, por ejemplo a ninos y a sus abuelos en busca del texto electronico de Peter Pan despues de haber visto la pelicula Hook, de la version electronica de Alicia en el pais de las maravillas tras haber visto una adaptacion televisiva, o del origen de una cita literaria tras visionar un episodio de Star Trek. En casi todos los episodios de Star Trek se citan libros disponibles en version digital en el Proyecto Gutenberg.
El objetivo, entonces, es que el publico, este o no este acostumbrado al contacto con el libro impreso, pueda encontrar con facilidad los textos escuchados en conversaciones, peliculas, musicas, o leidos en otros libros, periodicos y revistas.
Los textos electronicos (llamados tambien "etexts" o "ebooks") estan almacenados bajo la forma mas sencilla posible, en formato ASCII (American Standard Code for Information Interchange - Codigo Estadounidense Estandar para el Intercambio de Informacion), para que esos textos pudieran ser leidos sin problema con cualquier plataforma y software. Los terminos escritos en cursiva o en negrita y los terminos subrayados en la version impresa estan en letras capitales. Los archivos ASCII no ocupan mucho espacio y se pueden descargar facilmente. La busqueda textual es igual de sencilla. Basta con utilizar la funcion "buscar" presente en cualquier software.
Michael Hart explica en agosto de 1998 en una entrevista por correo electronico: "Nosotros consideramos el texto electronico como un nuevo medio de comunicacion, sin verdadera relacion con el papel. La unica semejanza es que ambos difundimos las mismas obras, pero en cuanto la gente se haya acostumbrado, no veo como el papel aun podria competir con el texto electronico, sobre todo en las escuelas. … Mi proyecto es cargar 10.000 textos electronicos en el internet [esta meta se alcanza en octubre de 2003]. Si pudiera conseguir subvenciones mas importantes, me gustaria llegar hasta un millon y ampliar tambien el numero de nuestros usuarios potenciales pasando de un 1,x% a un 10% de la poblacion mundial, lo que representaria la distribucion de 1.000 veces un billon de textos electronicos en lugar de un solo billon."
# De 1.000 a 10.000 ebooks
Entre 1998 y 2000, la produccion sigue constante, con una media de 36 nuevos ebooks al mes. En mayo de 1999, las colecciones cuentan con 2.000 libros digitales. El eBook #2000 es Don Quijote (publicado en 1605), en castellano.
Distributed Proofreaders (DP) es lanzado en octubre de 2000 por Charles Franks para repartir la correccion de las obras entre varias personas. Los voluntarios eligen uno de los libros digitales disponibles en el sitio web para releer y corregir determinada pagina. Cada cual trabaja a su ritmo. A titulo indicativo, se aconseja repasar una pagina al dia. Representa poco tiempo en un dia, pero mucho para el proyecto.
Disponible en diciembre del ano 2000, el eBook #3000 es el tercer volumen de A l'ombre des jeunes filles en fleurs (A la sombra de las muchachas en flor, 1919) de Marcel Proust, en su idioma original, el frances. La media pasa a 104 nuevos ebooks al mes en 2001.
El Project Gutenberg Australia es lanzado en agosto de 2001.
Disponible en octubre de 2001, el eBook #4000 es The French Immortals Series (Obras de los Inmortales franceses), en version inglesa. Publicado en 1905 por la Maison Mazarin (Paris), este libro reune varias ficciones de escritores laureados por la Academia de la Lengua Francesa (Academie Francaise), como Emile Souvestre, Pierre Loti, Hector Malot, Charles de Bernard, Alphonse Daudet y otros.
Disponible en abril de 2002, el eBook #5000 es The Notebooks of Leonardo da Vinci (Los cuadernos de Leonardo da Vinci), que datan de inicios de siglo 16, en una traduccion del italiano al ingles. En 2010, este texto aun se encuentra en el Top 100 de los libros descargados con mas frecuencia.
En 1991, Michael Hart decidio digitalizar Alice's Adventures in Wonderland o Peter Pan porque su version digital cupo en un disquete de 360 K (kilobytes), o sea el estandar de la epoca. Quince anos mas tarde, en 2002, ya disponemos de disquetes de 1,44 M (megabytes) con la posibilidad de comprimir archivos en archivos ZIP. Un archivo estandar puede contener tres millones de caracteres, o sea mas de los necesarios para un libro de tamano mediano, ya que una novela de 300 paginas digitalizada en formato ASCII representa 1 M (megabyte). Un libro voluminoso cabe en dos archivos ASCII, descargables en version normal o en version comprimida en un archivo ZIP.
Se necesitan unas cincuenta horas para seleccionar un libro de tamano mediano, comprobar que ha pasado al dominio publico, escanearlo, corregirlo, formatearlo y compaginarlo.
Algunos numeros de libros se reservan para mas tarde, por ejemplo el numero 1984 (eBook #1984) para la novela eponima de George Orwell, publicada en 1949, que aun esta lejos de pasar al dominio publico.
Al llegar la primavera de 2002, ya cubren un cuarto de las obras del dominio publico de libre acceso en la web, inventariadas de forma casi exhaustiva por la Internet Public Library (IPL - Biblioteca Publica del Internet), un buen resultado que es el fruto del trabajo paciente de miles de voluntarios activos en numerosos paises. En 2002, las colecciones se amplian de 203 nuevos ebooks al mes.
En noviembre de 2002, el Proyecto Gutenberg pone en linea los 75 archivos del Human Genome Project (Proyecto del Genoma Humano, es saber la secuenciacion del genoma humano), poco tiempo despues de su publicacion inicial en febrero de 2001, debido a que desde el principio ya pertenecia al dominio publico. Cada archivo se compone de decenas, o incluso de cientos de megabytes.
1.000 ebooks en agosto de 1997, 2.000 ebooks en mayo de 1999, 3.000 ebooks en diciembre de 2000, 4.000 ebooks en octubre de 2001, 5.000 ebooks en abril de 2002, 10.000 ebooks en octubre de 2003. El eBook #10.000 es The Magna Carta, que fue el primer texto constitucional ingles, firmado en 1215.
Entre abril de 2002 y octubre de 2003, las colecciones se duplican, pasando de 5.000 a 10.000 libros digitales en 18 meses. En 2003, la produccion es de unos 348 nuevos ebooks al mes. Este crecimiento rapido se debe a la actividad de Distributed Proofreaders (DP), concebido en octubre de 2000 para repartir la correccion de las obras entre muchos voluntarios.
En agosto de 2003, se pone a disposicion un CD Best of Gutenberg con una seleccion de 600 ebooks. En diciembre de 2003, fecha en la que el Proyecto Gutenberg alcanza la cifra de 10.000 libros digitales, se graba en un DVD la casi totalidad de los ebooks (9.400 ebooks). Se envian gratuitamente el CD y el DVD a cualquier persona que lo pida. Luego cada uno queda libre de realizar todas las copias que pueda y de distribuirlas a su alrededor en escuelas y bibliotecas.
En septiembre de 2003, el Proyecto Gutenberg lanza el Project Gutenberg Audio eBooks, una colleccion de libros audio (leidos por el ser humano), asi como el Sheet Music Subproject (Subproyecto para partituras), una colleccion de partituras digitalizadas y de grabaciones musicales. Un otro subproyecto tambien ofrece una colleccion de imagenes.
# De 10.000 a 20.000 ebooks
En diciembre de 2003, las colecciones rondan los 11.000 libros digitales. Varios formatos estan representados (HTML, XML, RTF, etc.) pero el formato principal - y obligatorio - sigue siendo el ASCII. Hay 46.000 archivos en conjunto, lo que equivale a una capacidad total de 110 G (gigabytes). El 13 de febrero de 2004, fecha en la que Michael Hart da una conferencia en la sede de la UNESCO en Paris, las colecciones abarcan exactamente 11.340 ebooks en 25 idiomas. En mayo de 2004, los 12.500 ebooks disponibles representan 100.000 archivos en veinte formatos diferentes, lo que equivale a una capacidad total de 135 G (gigabytes), y esta deberia duplicarse cada ano con la agregacion de mas de 300 ebooks al mes (338 ebooks al mes en 2004).
El Project Gutenberg Consortia Center (PGCC), lanzado en 1997 para reunir otras colecciones de libros digitales en un punto de acceso unico, es afiliado oficialmente al Proyecto Gutenberg en 2003.
Se inicia tambien un proyecto europeo a iniciativa del Proyecto Rastko, basado en Belgrado (Serbia). El Proyecto Gutenberg Europa y Distributed Proofreaders Europa nacen en enero de 2004, con cien libros disponibles para abril de 2005, en varios idiomas con el fin de reflejar la diversidad lingueistica que prevalece en Europa.
En enero de 2005, el Proyecto Gutenberg pone en linea el eBook #15000, The Life of Reason (La vida de la razon, 1906) de George Santayana.
Si bien en febrero de 2004 solo habia libros en 25 idiomas, en julio de 2005 estan representados 42 idiomas, entre los cuales el sanscrito y las lenguas maya.
El Project Gutenberg Australia (lanzado en agosto de 2001) celebra sus 500 libros en julio de 2005.
En enero de 2006 se crea el Project Gutenberg PrePrints para acoger nuevos documentos que por su interes merecerian estar en linea, pero que no pueden ser incorporados a las colecciones existentes sin su procesamiento previo por voluntarios: colecciones incompletas, calidad insuficiente, necesidad de conversion a otro formato, etc. Los PrePrints cuentan con 379 ebooks en diciembre de 2006, y 2.020 ebooks en febrero de 2009.
En diciembre de 2006, el Proyecto Gutenberg alcanza los 20.000 libros digitales. El eBook #20000 es un libro audio, Twenty Thousand Leagues Under the Sea (Veinte mil leguas de viaje submarino, 1869), la version inglesa de la novela de Julio Verne en frances. En 2006, la produccion es de unos 345 nuevos ebooks al mes.
Aunque se hayan necesitado 32 anos y tres meses, de julio de 1971 a octubre de 2003, para producir los 10.000 primeros ebooks, bastara con solo tres anos y dos meses, de octubre de 2003 a diciembre de 2006, para producir los 10.000 ebooks siguientes.
Por la misma fecha, el Project Gutenberg Australia ronda los 1.500 ebooks (se alcanza esta cifra en abril de 2007) y el Proyecto Gutenberg Europa cuenta con 400 ebooks.
En diciembre de 2006 figuran 50 idiomas. Diez idiomas cuentan con colecciones de mas de 50 libros: el ingles (17.377 libros el 16 de diciembre de 2006), el frances (966 libros), el aleman (412 libros), el finlandes (344 libros), el holandes (244 libros), el espanol (140 libros), el italiano (102 libros), el chino (69 libros), el portugues (68 libros) y el tagalog (51 libros).
# De 20.000 a 30.000 ebooks
Se estrena el blog Project Gutenberg News en noviembre de 2006 a instigacion de Mike Cook, para complementar las cartas de informacion (semanal y mensual) que ya llevaban muchos anos de existencia.
El blog presenta por ejemplo las estadisticas de produccion semanales, mensuales y anuales desde 2001.
La produccion semanal se eleva a 24 libros en 2001, 47 libros en 2002, 79 libros en 2003, 78 libros en 2004, 58 libros en 2005 y 80 libros en 2006.
La produccion mensual es de 104 libros en 2001, 203 libros en 2002, 348 libros en 2003, 338 libros en 2004, 252 libros en 2005 y 345 libros en 2006.
La produccion anual es de 1.244 libros en 2001, 2.432 libros en 2002, 4.176 libros en 2003, 4.058 libros en 2004, 3.019 libros en 2005 y 4.141 libros en 2006.
El Proyecto Gutenberg Canada (PGC) ve la luz el 1 deg. de julio de 2007, dia de la fiesta nacional, a instigacion de Michael Shepard y David Jones. Poco despues nace Distributed Proofreaders Canada (DPC) cuya produccion empieza en diciembre de 2007. Los cien primeros ebooks estan disponibles en marzo de 2008, en ingles, en frances y en italiano.
Distributed Proofreaders (DP), lanzado en octubre de 2000, cuenta con miles de voluntarios en enero de 2008, con un total de 11.934 libros procesados en siete anos y tres meses. Distributed Proofreaders Europa (DP Europe), lanzado en enero de 2004, cuenta con 1.500 voluntarios. Distributed Proofreaders Canada (DPC), lanzado en diciembre de 2007, cuenta con 250 voluntarios.
El Proyecto Gutenberg alcanza los 25.000 libros digitales en abril de 2008. El eBook #25000 es English Book Collectors (Colleccionistas ingleses de libros, 1902) de William Younger Fletcher.
El Proyecto Gutenberg Europa alcanza los 500 libros en octubre de 2008.
El Proyecto Gutenberg contabiliza 30.000 libros en octubre de 2009. El eBook #30000 es The Bird Book (El libro de los aves, 1915), de Chester Albert Reed.
# 30.000 ebooks y mas
Distributed Proofreaders celebra su decimo aniversario en octubre de 2010, con mas de 18.000 libros digitalizados y corregidos en diez anos por miles de voluntarios.
El Proyecto Gutenberg cuenta con mas de 33.000 ebooks en diciembre de 2010, en varios formatos para lectura en un ordenador, un PDA, un telefono movil, un smartphone o una tableta.
LE PROJET GUTENBERG A 40 ANS [FR]
Au 16e siecle, Gutenberg avait permis a chacun d'avoir des livres imprimes pour un prix relativement modique. Au 21e siecle, le Projet Gutenberg permettrait a chacun d'avoir une bibliotheque numerique gratuite.
# Gestation
Quels furent les tous debuts du projet? Alors etudiant a l'Universite de l'Illinois (Etats-Unis), Michael Hart se voit attribuer quelques millions de dollars de "temps machine" dans le laboratoire informatique de son universite.
Le 4 juillet 1971, jour de la fete nationale, il saisit The United States Declaration of Independence (Declaration de l'independance des Etats-Unis) sur le clavier de son ordinateur, en caracteres majuscules, puisque les caracteres minuscules n'existent pas encore. Le texte electronique represente 5 Ko (kilo-octets). L'envoi d'un fichier de 5 Ko a la centaine de personnes utilisant le pre-internet de l'epoque aurait fait imploser celui-ci, la bande passante etant infime. Michael diffuse donc un message indiquant ou le texte est stocke - sans lien hypertexte toutefois, puisque le web ne voit le jour que vingt ans apres - suite a quoi le fichier est telecharge par six personnes. Le Projet Gutenberg est ne.
Dans la foulee, Michael decide de consacrer l'enorme credit-temps mis a sa disposition a la recherche des oeuvres litteraires disponibles dans les bibliotheques et a la numerisation de celles-ci. Au lieu d'etre un ensemble de pages reliees, le livre sera un texte electronique pouvant etre deroule en continu.
Peu apres, Michael definit la mission du Projet Gutenberg: mettre a la disposition de tous gratuitement, par voie electronique, le plus grand nombre possible d'oeuvres litteraires.
Apres avoir saisi The United States Declaration of Independence (Declaration de l'independance des Etats-Unis, signee le 4 juillet 1776) en 1971, Michael poursuit ses efforts en 1972 en saisissant The United States Bill of Rights (Declaration des droits des Etats-Unis). Ce texte comprend les dix premiers amendements ajoutes en 1789 a la Constitution des Etats-Unis (qui date elle-meme de 1787), et definissant les droits individuels des citoyens et les pouvoirs respectifs du gouvernement federal et des Etats. En 1973, un volontaire saisit The United States Constitution (Constitution des Etats-Unis) dans son entier.
L'internet, qui etait encore embryonnaire en 1971, debute veritablement en 1974, suite a la creation du protocole TCP/IP (Transmission Control Protocol / Internet Protocol).
D'annee en annee, la capacite de la disquette augmente regulierement - le disque dur n'existe pas encore -, si bien qu'il est possible d'envisager des fichiers de plus en plus volumineux. Des volontaires entreprennent la numerisation de La Bible, composee elle-meme de plusieurs livres pouvant etre traites separement et occuper chacun un fichier different.
Michael Hart debute la saisie des oeuvres completes de Shakespeare, avec l'aide de volontaires, une piece de theatre apres l'autre, avec un fichier pour chaque piece. Cette version n'est d'ailleurs jamais mise en ligne, du fait d'une loi plus contraignante sur le copyright entree en vigueur dans l'intervalle, et qui vise non pas le texte de Shakespeare, tombe depuis longtemps dans le domaine public, mais les commentaires et notes de l'edition correspondante. D'autres editions annotees appartenant au domaine public sont mises en ligne quelques annees plus tard.
# De 10 a 1.000 ebooks
En aout 1989, le Projet Gutenberg met en ligne l'eBook #10, The King James Bible, une bible publiee pour la premiere fois en 1611 et dont la version la plus connue date de 1769. L'ensemble des fichiers de l'Ancien Testament et du Nouveau Testament represente 5 Mo (mega- octets).
En 1990, les internautes sont au nombre de 250.000, et le standard en vigueur est la disquette de 360 Ko. En janvier 1991, Michael Hart saisit Alice's Adventures in Wonderland (Alice au pays des merveilles, 1865) de Lewis Carroll. En juillet de la meme annee, il saisit Peter Pan (1904) de James M. Barrie. Ces deux classiques de la litterature enfantine tiennent chacun sur une disquette standard.
Arrive ensuite le web, operationnel en 1991. Le premier navigateur, Mosaic, apparait en novembre 1993. Lorsque l'utilisation du web se generalise, il devient plus facile de faire circuler les textes electroniques et de recruter des volontaires.
Le Projet Gutenberg rode sa methode de travail, avec la numerisation d'un texte par mois en 1991, deux textes par mois en 1992, quatre textes par mois en 1993 et huit textes par mois en 1994.
En janvier 1994, le Projet Gutenberg met en ligne l'eBook #100, The Complete Works of William Shakespeare (Les oeuvres completes de William Shakespeare). Shakespeare ecrivit l'essentiel de son oeuvre entre 1590 et 1613.
La production continue ensuite d'augmenter, avec une moyenne de 16 nouveaux titres par mois en 1995 et 32 nouveaux titres par mois en 1996.
Comme on le voit, entre 1991 et 1996, la production double chaque annee. Tout en continuant de numeriser des livres, Michael coordonne desormais le travail de dizaines de volontaires.
En 1997, la production est toujours de 32 nouveaux titres par mois. En juin 1997, le Projet Gutenberg met en ligne The Merry Adventures of Robin Hood (Les aventures de Robin des Bois, 1883) de Howard Pyle. En aout 1997, il met en ligne l'eBook #1000, La Divina Commedia (La Divine Comedie, 1321) de Dante Alighieri, dans sa langue d'origine, en italien.
A l'epoque, le Projet Gutenberg s'articule en trois grands secteurs: (a) "Light Literature" (litterature de divertissement), qui inclut par exemple Alice's Adventures in Wonderland, Peter Pan ou Aesop's Fables (Fables d'Esope); (b) "Heavy Literature" (litterature "serieuse"), qui inclut par exemple La Bible, les oeuvres de Shakespeare ou Moby Dick; (c) "Reference Literature" (litterature de reference), composee d'encyclopedies et de dictionnaires, par exemple le Roget's Thesaurus. Un classement par rubriques plus detaille remplacera par la suite ces trois secteurs.
Le Projet Gutenberg se veut universel, aussi bien pour les oeuvres choisies que pour le public vise, le but etant de mettre la litterature a la disposition de tous, en depassant largement le public habituel des etudiants et des enseignants. Le secteur consacre a la litterature de divertissement est destine a amener devant l'ecran un public tres divers, par exemple des enfants et leurs grands-parents recherchant le texte electronique de Peter Pan apres avoir vu le film Hook, ou recherchant la version electronique d'Alice au pays des merveilles apres avoir regarde l'adaptation filmee a la television, ou recherchant l'origine d'une citation litteraire apres avoir vu un episode de Star Trek. Pratiquement tous les episodes de Star Trek citent des livres ayant leur correspondant numerique dans le Projet Gutenberg.
L'objectif est donc que le public, qu'il soit familier ou non avec le livre imprime, puisse facilement retrouver des textes entendus dans des conversations, des films, des musiques, ou alors lus dans d'autres livres, journaux et magazines.
Les textes electroniques (appeles "etexts" ou "ebooks") sont stockes de la maniere la plus simple possible, au format ASCII (American Standard Code for Information Interchange), pour que ces textes puissent etre lus sans probleme quels que soient la plateforme et le logiciel utilises. Des lettres capitales remplacent les termes en italique, en gras et soulignes de la version imprimee. Les fichiers electroniques prennent peu de place et peuvent etre facilement telecharges. La recherche textuelle est tout aussi simple. Il suffit d'utiliser la fonction "rechercher" presente dans n'importe quel logiciel.
Michael Hart ecrit en aout 1998 lors d'un entretien par courriel: "Nous considerons le texte electronique comme un nouveau medium, sans veritable relation avec le papier. Le seul point commun est que nous diffusons les memes oeuvres, mais je ne vois pas comment le papier peut concurrencer le texte electronique une fois que les gens y sont habitues, particulierement dans les etablissements d'enseignement…. Mon projet est de mettre 10.000 textes electroniques sur l'internet. [NDLR: Ce sera chose faite en octobre 2003.] Si je pouvais avoir des subventions importantes, j'aimerais aller jusqu'a un million et etendre aussi le nombre de nos usagers potentiels de 1,x% a 10% de la population mondiale, ce qui representerait la diffusion de 1.000 fois un milliard de textes electroniques, au lieu d'un milliard seulement."
# De 1.000 a 10.000 ebooks
Entre 1998 et 2000, la moyenne est constante, avec 36 nouveaux titres par mois. En mai 1999, les collections comptent 2.000 livres numeriques. L'eBook #2000 est Don Quijote (Don Quichotte, 1605) de Cervantes, dans sa langue d'origine, en espagnol.
Distributed Proofreaders (DP) est lance en octobre 2000 par Charles Franks pour permettre la correction partagee des livres entre de nombreux volontaires. Les volontaires choisissent un livre en cours de traitement pour relire et corriger une page donnee. Chacun travaille a son propre rythme. A titre indicatif, il est conseille de relire une page par jour. C'est peu de temps sur une journee, et c'est beaucoup pour le projet.
Disponible en decembre 2000, l'eBook #3000 est le troisieme volume de A l'ombre des jeunes filles en fleurs (1919) de Marcel Proust, dans sa langue d'origine, en francais. La moyenne passe a 104 livres par mois en 2001.
Le Project Gutenberg Australia voir le jour en aout 2001.
Mis en ligne en octobre 2001, l'eBook #4000 est The French Immortals Series (Collection de textes d'Immortels francais), dans sa traduction anglaise. Publie a Paris en 1905 par la Maison Mazarin, ce livre rassemble plusieurs fictions d'ecrivains couronnes par l'Academie francaise, comme Emile Souvestre, Pierre Loti, Hector Malot, Charles de Bernard, Alphonse Daudet, etc.
Disponible en avril 2002, l'eBook #5000 est The Notebooks of Leonardo da Vinci (Les Carnets de Leonard de Vinci), des carnets datant du debut du 16e siecle et traduits de l'italien vers l'anglais. Ces carnets ont constamment ete dans le Top 100 des livres telecharges depuis leur mise en ligne.
En 1991, Michael Hart avait choisi de numeriser Alice's Adventures in Wonderland et Peter Pan parce que, dans l'un et l'autre cas, leur version numerisee tenait sur une disquette de 360 Ko, le standard de l'epoque. Quinze ans plus tard, en 2002, on dispose de disquettes de 1,44 Mo et on peut aisement compresser les fichiers en les zippant. Un fichier standard peut desormais comporter trois millions de caracteres, plus qu'il n'en faut pour un livre de taille moyenne, puisqu'un roman de 300 pages numerise au format ASCII represente un mega-octet. Un livre volumineux tient sur deux fichiers ASCII, telechargeables tels quels ou en version zippee.
Cinquante heures environ sont necessaires pour selectionner un livre de taille moyenne, verifier qu'il est bien du domaine public, le scanner, le corriger, le formater et le mettre en page.
Quelques numeros de livres sont reserves pour l'avenir, par exemple le numero 1984 (eBook #1984) pour le roman eponyme de George Orwell, publie en 1949, et qui est donc loin d'etre tombe dans le domaine public.
Au printemps 2002, les collections representent le quart des oeuvres du domaine public en acces libre sur le web, recensees de maniere pratiquement exhaustive par l'Internet Public Library (IPL), un beau resultat du au patient travail de milliers de volontaires actifs dans de nombreux pays. En 2002, la production est de 203 nouveaux titres par mois.
En novembre 2002, le Projet Gutenberg met en ligne les 75 fichiers du Human Genome Project (Projet du genome humain, a savoir le sequencage du genome humain), ceci peu de temps apres sa parution initiale en fevrier 2001, puisqu'il appartient d'emblee au domaine public. Chaque fichier se chiffre en dizaines sinon en centaines de mega-octets.
1.000 livres en aout 1997, 2.000 livres en mai 1999, 3.000 livres en decembre 2000, 4.000 livres en octobre 2001, 5.000 livres en avril 2002, 10.000 livres en octobre 2003. L'eBook #10000 est The Magna Carta, qui fut le premier texte constitutionnel anglais, signe en 1215.
Entre avril 2002 et octobre 2003, les collections doublent, passant de 5.000 a 10.000 livres en dix-huit mois. La moyenne mensuelle est de 348 nouveaux titres en 2003. Cette croissance rapide est due a l'activite de Distributed Proofreaders (DP), un site concu en octobre 2000 pour permettre la correction partagee des livres entre de nombreux volontaires.
En aout 2003, un CD Best of Gutenberg est disponible avec une selection de 600 ebooks. En decembre 2003, date a laquelle le Projet Gutenberg fete ses 10.000 ebooks, la quasi-totalite de ceux-ci (9.400 ebooks) est gravee sur un DVD. CD et DVD sont envoyes gratuitement a qui en fait la demande. Libre ensuite a chacun de faire autant de copies que possible et de les distribuer autour de soi dans des ecoles et des bibliotheques.
En septembre 2003, le Projet Gutenberg lance le Projet Gutenberg Audio eBooks, une collection de livres audio (lus par l'etre humain), ainsi que le Sheet Music Subproject (Sous-projet pour les partitions musicales), une collection rassemblant des partitions musicales et des enregistrements musicaux. Un autre sous-projet rassemble des images fixes et animees.
# De 10.000 a 20.000 ebooks
En decembre 2003, les collections approchent les 11.000 ebooks. Plusieurs formats sont desormais presents, par exemple les formats HTML, XML et RTF, le format principal - et obligatoire - restant l'ASCII. Le tout represente 46.000 fichiers, soit une capacite totale de 110 Go (giga-octets). Le 13 fevrier 2004, date de la conference de Michael Hart au siege de l'UNESCO a Paris, les collections comprennent tres exactement 11.340 ebooks dans 25 langues. En mai 2004, les 12.500 ebooks disponibles representent 100.000 fichiers dans une vingtaine de formats, soit une capacite totale de 135 Go, destinee a doubler chaque annee avec l'ajout d'environ 300 ebooks par mois (338 ebooks en 2004).
Parallelement, le Project Gutenberg Consortia Center (PGCC), qui avait ete lance en 1997 pour rassembler des collections de livres numeriques deja existantes et provenant de sources diverses, est officiellement affilie au Projet Gutenberg en 2003.
Le Projet Gutenberg Europe est lance en janvier 2004 a l'instigation du Projet Rastko, base a Belgrade, en Serbie. Distributed Proofreaders Europe debute la production de livres numeriques a la meme date, avec cent livres disponibles en avril 2005. Les livres sont en plusieurs langues pour refleter la diversite linguistique prevalant en Europe.
En janvier 2005, le Projet Gutenberg met en ligne l'eBook #15000, The Life of Reason (La vie de raison, 1906) de George Santayana.
En juin 2005, le nombre de livres s'eleve a 16.000. Si 25 langues seulement etaient presentes en fevrier 2004, 42 langues sont representees en juin 2005, dont le sanscrit et les langues mayas.
Le Project Gutenberg Australia (lance en aout 2001) fete ses 500 livres en juillet 2005.
Un nouveau secteur, denomme Project Gutenberg PrePrints, est lance en janvier 2006 pour accueillir de nouveaux documents suffisamment interessants pour etre mis en ligne, mais ne pouvant etre integres aux collections du Projet Gutenberg sans traitement ulterieur par des volontaires, pour diverses raisons: collections incompletes, qualite insuffisante, conversion souhaitee dans un autre format, etc. Les PrePrints comprennent 379 ebooks en decembre 2006, et 2.020 ebooks en fevrier 2009.
En decembre 2006, le Projet Gutenberg franchit la barre des 20.000 livres. L'eBook #20000 est un livre audio, Twenty Thousand Leagues Under the Sea, version anglaise du roman Vingt mille lieues sous les mers (1869) de Jules Verne. La moyenne est de 345 nouveaux titres par mois en 2006.
S'il a fallu 32 ans et deux mois, de juillet 1971 a octobre 2003, pour numeriser les 10.000 premiers livres, il n'aura fallu que trois ans et deux mois, d'octobre 2003 a decembre 2006, pour numeriser les 10.000 livres suivants.
A la meme date, le Project Gutenberg Australia approche les 1.500 livres (c'est chose faite en avril 2007) et le Projet Gutenberg Europe compte 400 livres.
En decembre 2006, on compte 50 langues. Les dix langues comprenant plus de cinquante livres sont l'anglais (17.377 livres le 16 decembre 2006), le francais (966 livres), l'allemand (412 livres), le finnois (344 livres), le hollandais (244 livres), l'espagnol (140 livres), l'italien (102 livres), le chinois (69 livres), le portugais (68 livres) et le tagalog (51 livres).
# De 20.000 a 30.000 ebooks
Project Gutenberg News, le blog officiel du Projet Gutenberg, debute en novembre 2006 a l'instigation de Mike Cook. Ce blog complete les lettres d'information (hebdomadaire et mensuelle) existant depuis nombre d'annees. Le blog offre par exemple les statistiques de production hebdomadaires, mensuelles et annuelles depuis 2001.
La production hebdomadaire est de 24 livres en 2001, 47 livres en 2002, 79 livres en 2003, 78 livres en 2004, 58 livres en 2005 et 80 livres en 2006.
La production mensuelle est de 104 livres en 2001, 203 livres en 2002, 348 livres en 2003, 338 livres en 2004, 252 livres en 2005 et 345 livres en 2006.
La production annuelle est de 1.244 livres en 2001, 2.432 livres en 2002, 4.176 livres en 2003, 4.058 livres en 2004, 3.019 livres en 2005 et 4.141 livres en 2006.
Le Projet Gutenberg Canada (PGC) voit le jour le 1er juillet 2007, le jour de la fete nationale, a l'instigation de Michael Shepard et David Jones. Il est suivi de Distributed Proofreaders Canada (DPC), avec une production qui debute en decembre 2007. Les cent premiers livres sont disponibles en mars 2008, en anglais, en francais et en italien.
Le Projet Gutenberg envoie 15 millions de livres sur CD ou DVD par courrier postal en 2007. Le DVD le plus recent (qui date de juillet 2006) comprend 17.000 livres. Le contenu des CD et DVD est egalement disponible sous forme de fichiers ISO (depuis 2005) peuvant etre telecharges pour graver des CD et DVD.
Le Projet Gutenberg compte 25.000 livres en avril 2008. L'eBook #25000 est English Book Collectors (Collectionneurs de livres anglais, 1902) de William Younger Fletcher.
Le Projet Gutenberg Europe atteint les 500 livres en octobre 2008.
Le Projet Gutenberg comptabilise 30.000 livres en octobre 2009. L'eBook #30000 est The Bird Book (Le livre des oiseaux, 1915), de Chester Albert Reed.
# 30.000 ebooks et plus
Principale source des livres du Projet Gutenberg, Distributed Proofreaders (DP) fete son dixieme anniversaire en octobre 2010, avec plus de 18.000 livres patiemment numerises, relus et corriges pendant dix ans par plusieurs milliers de volontaires.
Le Projet Gutenberg propose plus de 33.000 ebooks de grande qualite en decembre 2010, dans divers formats pour lecture sur ordinateur, PDA, telephone mobile, smartphone et tablette.
FROM THE PAST TO THE FUTURE [EN]
The results of Project Gutenberg are not only measured in numbers. The results can also be measured in the major influence the project has had.
# Other digital libraries
As the oldest producer of free ebooks on the internet, Project
Gutenberg has inspired many other digital libraries, for example
Projekt Runeberg for classic Nordic (Scandinavian) literature, and
Projekt Gutenberg-DE for classic German literature, which started
respectively in 1992 and 1994.
Projekt Runeberg was the first Swedish digital library of books from public domain, and a partner of Project Gutenberg. It was initiated in December 1992 by the students' computer club Lysator, in cooperation with the Linkoeping University (Sweden), as a volunteer project to create and collect free electronic editions of classic Nordic literature and art. Around 200 ebooks were available in full text in 1998. There was also a list of 6,000 Nordic authors as a tool for further collection development.
Projekt Gutenberg-DE was the first German digital library of books from public domain, created in 1994 as a partner of Project Gutenberg. Texts were available for online reading, with one webpage for short texts and with several webpages - one per chapter - for longer works. There was an alphabetic list of authors and titles, and a short biography and bibliography for each author.
# "Less is more."
Project Gutenberg has kept its administrative and financial structure to the bare minimum. Its motto fits into three words: "Less is more." The goal is to ensure its independence from loans and other funding, and from ephemeral cultural priorities, to avoid pressure from politicians and others. The goal is also to ensure respect for the volunteers, who can be confident their work will be used for decades. Volunteers can network through mailing lists, weekly or monthly newsletters, discussion lists, forums, and wikis. Founded in 2000, the PGLAF (Project Gutenberg Literary Archive Foundation) has only three part-time employees.
Donations are used to buy equipment and supplies, mostly computers, scanners, and blank CDs and DVDs. CDs and DVDs are sent for free to those who request them. After the CD Best of Gutenberg available in August 2003 with a selection of 600 ebooks, and a first DVD available in December 2003 with 9,400 ebooks, a second DVD is available in July 2006 with 17,000 ebooks. Since 2005, CDs and DVDs have been both available on the website of BitTorrent as ISO images that can be downloaded to burn CDs and DVDs for personal use. In 2007, the Project Gutenberg sent 15 million books by snail mail on CDs and DVDs.
More generally, Michael Hart should be given more credit as the inventor of the electronic book (ebook). If we consider the ebook in its etymological sense - i.e. a book that has been digitized to be distributed as an electronic file - it was born with Project Gutenberg in July 1971, 30 years before the various commercial launchings that peppered the early 2000s, with the ebooks of Amazon, Barnes & Noble, Gemstar, and others.
# Tens of thousands of downloads per day
There is a big demand, as confirmed by the tens of thousands of books that are downloaded every day.
For example, on July 31, 2005, there were 37,532 downloads for the day, 243,808 downloads for the week, and 1,154,765 downloads for the month.
On May 6, 2007, there were 89,841 downloads for the day, 697,818 downloads for the week, and 2,995,436 downloads for the month.
On November 15, 2010, there were 130,524 downloads for the day, 888,520 downloads for the week, and 3,582,153 downloads for the month.
These numbers are the downloads from ibiblio.org (at the University of North Carolina, Chapel Hill, United States), the main distribution site, which also hosts the website gutenberg.org. The Internet Archive is the backup distribution site and provides unlimited disk space for storage and processing. Project Gutenberg has 40 mirror sites worldwide, and seeks new ones. It also encourages the use of P2P for sharing its ebooks.
Readers can choose ebooks from the "Top 100?, i.e. the top 100 ebooks and the top 100 authors for the previous day, the last seven days and the last thirty days.
Project Gutenberg ebooks can also help bridge the "digital divide". They can be read on an outdated computer or a second-hand netbook costing just a few dollars.
# Towards the future