Herramientas de usuario

Herramientas del sitio


public:docencia:univmajorsculturalibre:tema7

¡Esta es una revisión vieja del documento!


Grandes repositorios multimedia

Un poco de historia...

Todo esto remonta a la Antigüedad, en concreto, al siglo III antes de nuestra era. El rey Ptolomeo I de Egipto decidió hacer de Alejandría la capital cultural de su reino y del mundo helenístico. Manda contruir un museo que albergará una universidad, una academia y una biblioteca. El objetivo de esta biblioteca, contruida en el año 288 antes de nuestra era, consistirá en almacenar en un mismo lugar todo el conocimiento universal… Ptolomeo I ordena que todos los libros contenidos en los barcos que llegan al puerto de Alejandría sean copiados y traducidos (la Biblioteca se queda con el original y el barco con una copia), se compran o copian obras de diversas procedencias ; e incluso la leyenda dice que el sucesor de Ptolomeo I, Ptolomeo II, pidió a todos los reyes y grandes del mundo que mandarán las obras de todas las categorías de autores de sus regiones. En época de Julio César (100 a.C.-44 a.C.), la Biblioteca de Alejandría alcanzaba los 700.000 volúmenes. No se sabe si fue consecuencia de las guerras entre César y Pompeyo, o si fue a raíz de unos conflictos entre paganismo y cristianismo en el siglo III, o si fue por la conquista árabe en la Edad Media temprana, pero lo cierto es que la Biblioteca de Alejandría fue destruida y su fabuloso fondo desapareció.

Durante siglos, los libros y las bibliotecas fueron privilegio de unos pocos, hasta que Gutenberg inventó la imprenta (su primer libro impreso fue una Biblia, en 1457), lo que permitió popularizar el acceso a los libros. Pero aún así, las bibliotecas eran espacios privados, reservados, a los que sólo podían acceder unos pocos.

Ilustración: Una escena de « Los Desposados » de Alessandro Manzoni, en la que aparece el Cardenal Federico Borromeo (Wikimedia Commons).

El caso es lo bastante raro como para no mencionarlo: en 1609, en Milán, el cardenal Federico Borromeo (1564-1631) mandó construir una biblioteca pública, la Biblioteca Ambrosiana, para albergar sus propios libros y colecciones de arte. Para completar sus estantes, el cardenal ordenó el despliegue de toda una red de investigadores y traductores que recorrían el mundo para adquirir las obras importantes del conocimiento humano. La gran novedad de esta biblioteca era que los volúmenes se encontraban almacenados en estanterías (en lugar de cajas, como se solía hacer en aquella época), y sobre todo, que cualquiera (no sólo los eruditos y religiosos) podía no sólo entrar en la Biblioteca, sino acceder a los libros… (muy interesante el capítulo dedicado a Federico Borromeo y la Biblioteca Ambrosiana en la emblemática novela « Los Desposados » de Alessandro Manzoni (1821)).

Ilustración: Melvil Dewey (Wikimedia Commons).

A finales del siglo XIX, los bibliotecarios de todo el mundo empiezan a preocuparse por organizar los fondos de sus bibliotecas y sobre todo universalizar esta organización. Empiezan a ver la luz los sistemas de clasificación de los fondos bibliográficos: la idea consiste en dividir el conocimiento en diversas ramas y asignar a cada rama y sus subdivisiones, un código. Si se clasificaran los fondos de todas las bibliotecas del mundo siguiendo este sistema, un mismo libro se clasificaría de la misma manera, que se encuentre en una biblioteca de Nueva York, de Madrid o de Pekín. En 1876, Melvil Dewey crea el Sistema Dewey de Clasificación, que los belgas Paul Otlet y Henri La Fontaine retomarán y mejorarán en 1895, para crear la Clasificación Decimal Universal. Los dos sistemas se han ampliado con el paso de los años, pero todavía hoy están en uso… (en la biblioteca de la UJI se utiliza otro sistema de clasificación, el de la Biblioteca del Congreso de Estados Unidos, más adaptado a los fondos de una biblioteca universitaria). Durante el siglo XX, se ha ido uniformizando toda una normativa internacional para la catalogación de las obras. Todo eso, combinado con el auge de Internet, ha permitido llegar a la creación de catálogos colectivos de bibliotecas, organizadas en redes: universitarias, públicas, nacionales…, estos catálogos agrupan las descripciones bibliográficas de las obras que incluyen y se pueden consultar en línea desde cualquier lugar del mundo. La creación de catálogos colectivos de bibliotecas ya constituía un gran paso hacia una nueva Biblioteca de Alejandría, receptáculo de todo el saber humano: una Biblioteca de Alejandría distribuida, repartida por todo el mundo, pero que permite localizar muy fácilmente cualquier volumen.

El siguiente gran paso llegó a principios del siglo XXI: la digitalización de las obras y su puesta en línea, libre y gratuitamente. Es lo que veremos a continuación.

Wikimedia Commons

Proyecto hermano de Wikipedia, Wikimedia Commons se creó en 2004. El objetivo inicial era de tener un banco de imágenes común que pudieran utilizar los colaboradores de Wikipedia de los distintos países, sin tener que «subir» la misma imagen cada vez que se traduce un artículo a un nuevo idioma. Pronto se convirtió en una referencia, gracias notablemente a su crecimiento exponencial: de 100.000 ficheros almacenados a sus inicios en 2004, alberga actualmente unos 14 millones de imágenes (cuadros, fotografías, grabados, ilustraciones…), grabaciones sonoras, textos y vídeos.

La particularidad de Wikimedia Commons es que todos los materiales almacenados pertenecen al dominio público o están publicados bajo algún tipo de licencia libre. Lo cual significa que cada cual puede gratuitamente copiar, reutilizar o modificar estos materiales, siempre que respetan las condiciones de redistribución de esos ficheros.

La tecnología wiki que da, como a Wikipedia, su estructura a Wikimedia Commons, garantiza un uso sencillo tanto a los navegantes como a los colaboradores que pueden añadir nuevos materiales sin tener conocimientos especiales.

Podríamos decir que Wikimedia Commons se compone de tres tipos de elementos básicos: los ficheros llamados media (imagen, sonido o vídeo básicamente), las páginas (page) y las categorías (category).

Por ejemplo, en relación con Miguel de Cervantes, podemos encontrar:

Cuando se realiza una consulta en el buscador, al teclear las primeras letras de un criterio de búsqueda, el sistema va proponiendo títulos de páginas disponibles en Wikimedia Commons. Por ejemplo, Madrid. Accedemos directamente a la página dedicada a la capital: en la que encontramos una selección de las imágenes más destacadas, fotos, mapas, cuadros. Si, al final de la página, seleccionamos la categoría Madrid, entraremos en la sección que contiene «todo lo que hay» sobre la ciudad, agrupado en subcategorías : Madrid in art, Videos from Madrid, Manzanares River… Según lo que busquemos, podremos ir a una subcategoría u otra.

Internet Archive

Internet Archive es una asociación sin ánimo de lucro, creada en California en 1996 por Brewster Kahle y dedicada al archivado de sedes web: es decir que de forma periódica, se realiza una copia de las sedes web de todo el mundo y se archivan estas instantáneas. A partir de 1999, Internet Archive fue ampliando sus contenidos a otros tipos de materiales, como libros, sonido, vídeos, software…, con el fin de lograr el almacenamiento de todo el conocimiento humano, siguiendo la idea de la Biblioteca de Alejandría (de hecho, tiene acuerdos para albergar un «espejo» de sus contenidos, con la flamante Bibliotheca Alexandrina, inaugurada en Alejandría en el año 2002). Desde 2001, esta colección está accesible libre y gratuitamente. En su mayoría, estos materiales forman parte del dominio público o están difundidos bajo licencias Creative Commons permitiendo su redistribución.

Más de 3.600.000 libros, 1.300.00 grabaciones sonoras, 700.000 vídeos, 42.000 programas de ordenador, sin contar los 150 mil millones de web archivados, componen este fondo que ha sido reconocido oficialmente como biblioteca por el Estado de California.

  • Wayback Machine es el nombre de la sección dedicada al archivado de sedes web. Como anécdota, saca su nombre de una serie televisiva de dibujos animados en la que aparecía una máquina del tiempo llamada WABAC Machine y que servía para describir los grandes acontecimientos históricos. La frecuencia de captura de instantáneas no es fija. Pueden transcurrir hasta varias semanas entre dos capturas. Las copias permanecen disponibles en línea entre 6 y 12 meses. Existe una modalidad bajo suscripción, llamada Archive-it, que permite a los propietarios y autores de sedes web almacenar diariamente sus contenidos. Mencionaremos que estos archivos están siendo utilizados por la justicia como elementos decisivo en ciertos pleitos sobre violación de copyright o de patentes…

Ilustración: Frank Baum - «The Marvellous Land of Oz» (1904).

  • Muchos de los vídeos han sido proporcionados por cadenas de televisión, pero también por los propios internautas. En la sección de Moving images (vídeo y películas), son de destacar:

Como muchos tesoros, los que están almacenados en los fondos de Internet Archive suelen ser bastante difíciles de encontrar. Al ser el fondo tan extenso, muchas veces cuando realizamos una consulta, no encontramos con que o bien no encontramos nada o el sistema nos devuelve una multitud de resultados entre los que no sabemos elegir… Las palabras clave de materias y las autoridades de autor no parecen tener mucha homogeneidad; por ejemplo, volviendo a Cervantes, podemos encontrar la forma normalizada «Cervantes de Saavedra, Miguel de», pero tambien, en algunos registros está introducido como «Miguel de Cervantes y Saavedra». Otra dificultad es que el buscador, contrariamente a buscadores como Google por ejemplo, distingue las letras acentuadas de las que no lo son. Busquemos el poeta francés Stéphane Mallarmé, tecleando «mallarme» y luego «mallarmé» y veremos que los resultados obtenidos no son idénticos en los dos casos (mientras que en Google encontraríamos lo mismo en los dos casos)…

Bibliografía

Derechos de autor y Dominio Público en Estados Unidos: desde 1976, la duración del derecho de autor en Estados Unidos era de 50 años después de la muerte del autor o 75 años desde la publicación de la obra en el caso de obras colectivas o registradas bajo un nombre de empresa. Eso significaba que la primera película de Mickey Mouse, «Steamboat Willie» (1928) debería haber entrado en el Dominio Público en 2003 (después de haber beneficiado de varias prórrogas en 1956 y 1984). En 1998 se aprobó una reforma de la ley, instigada por el cantante y político Sonny Bono, y apoyada, entre otros, por la Walt Disney Company y los herederos del compositor George Gershwin: la nueva ley, todavía en vigor, amplía el plazo a 95 años en el caso de obras colectivas o registradas bajo un nombre de empresa, el derecho de autor individual quedando de 70 años después de la muerte del autor. De esta manera, «Steamboat Willie» queda protegido hasta 2023. ¿Qué pasará entonces? Continuará… ;-)

En resumen:

  • todo lo publicado antes de 1923 forma parte del dominio público,
  • todo lo publicado antes del 1 de enero de 1964 sin haber renovado el copyright, forma parte del dominio público,
  • todo lo publicado antes del 1 de marzo de 1989 sin mencionar derechos de autor (ausencia de los símbolos « © », «Copyright» o «Copr.», seguidos del año de publicación y del nombre del que explota o detenta el copyright),
  • en el resto de casos, el copyright tiene una duración de 70 años después de la muerte del autor o 95 años desde la publicación de la obra en el caso de obras colectivas o registradas bajo un nombre de empresa.

Europeana

Europeana vio la luz en 2008, como iniciativa de la Comisión Europea. Fue el lanzamiento ese mismo año 2008 del proyecto de Google, Google Books, que llevó a los dirigentes europeos a interrogarse sobre la conservación y la divulgación del patrimonio cultural europeo y a plantear la idea inicial de una puesta en común de los recursos digitalizados por las bibliotecas nacionales de los Estados Miembros. Poco a poco, se han ido asociando al proyecto otras instituciones de todo tipo: bibliotecas universitarias, regionales y municipales por supuesto, pero también museos o centros de investigación. Alrededor de 1500 instituciones han participado con Europeana desde su creación. Entre ellas, mencionaremos, además de la Biblioteca Nacional de España (que tiene su propia biblioteca digital a la que podemos acceder por separado, la Biblioteca Digital Hispánica); bibliotecas de comunidades autónomas, la Biblioteca Valenciana Digital (BIVALDI) por ejemplo; o HISPANA, iniciativa del Ministerio de Educación, Cultura y Deportes, que «reúne las colecciones digitales de archivos, bibliotecas y museos de España, conformes a la Iniciativa de Archivos Abiertos que promueve la Unión Europea» que contiene en total casi 2.900.000 objetos digitales de 174 repositorios (por ejemplo, la Biblioteca Digital de Castellón de la Universitat Jaume I).

El prototipo de Europeana que se presentó en 2007 se componía de 12000 documentos digitalizados. Cinco años después, podemos acceder a más de 20 millones de obras: libros, ilustraciones, grabaciones sonoras o vídeos, procedentes de toda Europa.

Recientemente (Septiembre 2012), la Comisión Europea a anunciado que los meta-datos de Europeana estarán disponibles a partir de ahora bajo la licencia Creative Commons - Public Domain, lo cual permite a cualquiera copiar y reutilizar libremente estos meta-datos. Pero, los meta-datos no son las obras: sólo son los datos bibliográficos, o sea, las fichas descriptivas de las obras. En nuestro país, se ha difundido la noticia como que eran las obras las iban a formar parte del dominio público… (Noticia de ABC del 15 de septiembre: Se libera el acceso a los archivos de Europeana).

En realidad, muchos de los materiales accesibles desde Europeana forman parte del dominio público, pero se pueden encontrar obras que sólo se pueden consultar previo pago (por ejemplo, las grabaciones sonoras proporcionadas por DISMARC, una agrupación austriaca de discográficas). Cada centro, en función del material presentado, determina sus condiciones de acceso, las cuales vienen especificadas en las fichas de las obras en Europeana (en el apartado Rights en la columna de la izquierda).

Europeana no es más que un motor de búsqueda, accesible en los 21 idiomas oficiales de la Unión Europea, que facilita y centraliza el acceso a los documentos en las bibliotecas digitales que participan; pero no almacena los documentos digitalizados. Por lo tanto, cuando efectuamos una búsqueda en Europeana, consultaremos el documento final desde la biblioteca digital de la institución a la que pertenece la obra.

Para hacernos una idea de los materiales que podemos encontrar en Europeana, de su procedencia, de las diferencias en las menciones legales y de cómo se accede al documento final, vamos a estudiar lo que nos podemos encontrar sobre un autor valenciano: Vicente Blasco Ibáñez. Nuestro gran escritor murió en 1928, o sea hace más de 70 años, con lo cual sus obras ya forman parte del dominio público. Introducimos «Blasco Ibáñez» (con acento en la a de Ibáñez) en la herramienta de búsqueda y vemos que obtenemos un centenar de resultados. Entre todos ellos, destacaremos:

Ilustración: Vicente Blasco Ibáñez - «La Barraca» (1919).

  • «Ce que sera la République Espagnole», un ensayo de 1925, traducido al francés, también etiquetado como formando parte del Dominio Público. Al hacer clic sobre la imagen, leeremos el libro en Gallica, donde no solo podemos leerlo en línea, sino que lo podemos descargar (arriba a la derecha: «Descargar / De impresión»; la versión en español de Gallica suele dar alguna sorpresa lingüística…).
  • « Arènes sanglantes », traducción al francés de «Sangre y arena»; también nos indican que forma parte del Dominio Público, pero esta vez, el documento está almacenado en el fondo de la Biblioteca Digital de Castilla y León, la cual nos permite leer el libro en línea, pero no podemos ni descargar ni imprimir: los iconos del Disquete o de la Impresora sólo sirven para guardar una copia en formato imagen (jpg) o imprimir la página en curso.
  • Un retrato fotográfico de Vicente Blasco Ibáñez, propiedad de la Biblioteca Nacional de España, con una enigmática mención de Free Access con copyright… La sorpresa viene cuando intentamos acceder a la foto. Hacemos clic sobre ella y nos encontramos con una página de meta-datos, con URL de la Biblioteca Nacional, pero no podemos ver la imagen. Tendremos que acceder a la Biblioteca Digital Hispánica y volver a realizar la búsqueda para poder ver mejor esta foto y guardarla si nos apetece.
Aprovechamos para lamentar la falta de toma de posición clara de la Biblioteca Nacional sobre la pertenencia de sus obras al dominio público. Hemos comentado que la ficha de Europeana llevaba una enigmática mención de Free Access con copyright. Sin embargo, si nos fijamos en la descripción de la foto en la Biblioteca Digital Hispánica, vemos que el fotógrafo es anónimo. Dado que Blasco Ibáñez murió en 1928, la foto es obligatoriamente anterior a esta fecha; es decir que, como es anónima y tiene más de 70 años, forma parte del dominio público, pero no lo indican y le ponen un copyright. Si buscamos en Europeana otras obras pertenecientes a la Biblioteca Nacional de España, veremos que incluso documentos mucho más antiguos, para los cuales no puede haber ninguna ambigüedad en cuanto a su pertenencia al Dominio Público, llevan este mismo Free Access con copyright…Es una pena que la Biblioteca Nacional de España no se pronuncie claramente, como lo hacen otras Bibliotecas Nacionales o la misma Biblioteca Valenciana Digital, y no muestre y reivindique que sus obras pertenecen al Dominio Público.
Europeana es una herramienta imprescindible a la hora de buscar un documento concreto: podríamos recorrer uno por uno los catálogos de las distintas bibliotecas digitales de Europa, probando suerte, sin tener la garantía de encontrar lo que buscamos. Con Europeana, tenemos todos los catálogos europeos accesibles en un solo clic. Nos podemos encontrar sorpresas, como la que tuvimos al localizar «Arènes sanglantes» en la Biblioteca Digital de Castilla y León, mientras que no está en Gallica, la biblioteca digital gala. Por otro lado, podemos resignarnos, si no encontramos en Europeana el documento que buscamos, a que muy probablemente, no esté digitalizado por ninguna biblioteca europea…

Otros repositorios de interés

  • Library of Congress Digital Collections: desde 1994, la Librería del Congreso de Washington digitaliza sus fondos y los ofrece en acceso gratuito. Esencialmente dedicada a la historia de Estados Unidos, con secciones como American Memory o Historic Newspapers, también tiene colecciones variadas como International Collections (con fondos sobre las culturas de todo el mundo), Performing Arts (grabaciones de conciertos, obras de teatro…) o Early Sound Recordings (10.000 discos de 78 revoluciones digitalizados que se pueden escuchar en línea)…
Ejercicio.

Recientemente, se ha descubierto que la primera máquina del tiempo de la literatura no era la que imaginó H.W. Wells, sino que era… española. Se llamaba «El Anacronópete», y es la protagonista principal de una novela del mismo nombre, escrita en 1887 por Enrique Gaspar y Rimbau (1842-1902). ¿No les gustaría de saber qué aspecto tenía?

Libros

Proyecto Gutenberg

Ilustración: Michael Hart y Gregory Newby (Wikimedia Commons).

En 1971, a un estudiante americano de la Universidad de Illinois, le permitieron acceder a un ordenador muy potente. El joven Michael Hart quiso agradecer el favor que le hacían. Muy pronto, se dio cuenta de que la característica más valiosa de un ordenador no era el cálculo (como se pensaba hasta entonces), sino más bien su capacidad de almacenamiento, lo que permitiría en un futuro no tan lejano introducir en los ordenadores los documentos guardados en las bibliotecas y de esta manera, facilitar la recuperación de información de los fondos bibliográficos.

Se puso manos a la obra y decidió saldar su deuda moral por haberle permitido utilizar este ordenador (inusual en la época): introduciría textos emblemáticos de la historia y la literatura en aquel ordenador y los dejaría en acceso libre a través de la red de la Universidad, para que toda la comunidad universitaria pudiera acceder a estas obras. El primer texto que copió fue la «Declaración de la Independencia de Estados Unidos» y con él, Hart inventaba el primer libro electrónico (ebook), de la historia. Así nació el Proyecto Gutenberg, la veterana de las bibliotecas digitales. Hart continuó copiando (manualmente) obras tan variadas como la «Biblia» o «Alicia en el País de las maravillas». Poco a poco se fue ampliando el fondo.

Hasta 1989, todos los textos fueron tecleados manualmente por voluntarios del proyecto. Desde entonces, los avances tecnológicos permitieron escanear los libros y, con la ayuda de programas de reconocimiento de caracteres, agilizar considerablemente el proceso de introducción de nuevos libros.

El Proyecto Gutenberg es muy riguroso para la selección de las obras: tienen que respetar la ley estadounidense sobre el copyright. Con lo cual, sólo se pueden encontrar en este sitio, obras pertenecientes al Dominio Público estadounidense; básicamente se trata de obras literarias (poesía, teatro, narrativa), pero se pueden encontrar libros de cocina, revistas u obras de referencia…

Albergado por los servidores de sucesivas universidades desde su creación, el Proyecto Gutenberg se constituyó en el año 2000 en una asociación sin ánimo de lucro. Está financiado gracias a donativos y funciona gracias al trabajo de voluntarios. Voluntarios son también los que se dedican a la re-lectura y corrección de los textos escaneados, de manera a que el Proyecto Gutenberg ofrezca siempre textos muy cuidados, respetuosos de los originales impresos y sobre todo, sin caracteres no reconocidos.

Actualmente el Proyecto Gutenberg se compone de unas 40.000 obras, esencialmente en inglés, pero también en muchos otros idiomas (Chino, Alemán, Francés, Holandés, Italiano, Portugués, Español, Catalán…).

El catálogo del Proyecto Gutenberg es muy fácil de usar: disponemos de índices alfabéticos de autores y títulos y sólo tenemos que seleccionar la letra por la que empieza el apellido del autor o el título que nos interesan. También, para los impacientes, existe un buscador, que permite localizar los libros muy rápidamente.

No esperen encontrar en el Proyecto Gutenberg reproducciones de libros escaneados, como los vimos en Internet Archive. Desde los inicios del proyecto, Michael Hart apostó por el texto plano, porque consideraba que era la solución que más futuro tenía: al no tener ningún formato, podía ser leído por muchos dispositivos, independientemente de los cambios tecnológicos. El futuro le dio la razón ya que actualmente, los textos del Proyecto Gutenberg pueden, además de leerse en línea, descargarse en los formatos más comunes que utilizan los lectores electrónicos (e-readers): ePUB (el más universal, ya que se trata de un formato abierto y libre) y Kindle (para los lectores electrónicos de Amazon). Lo cual permite una difusión muy grande de las obras disponibles en el Proyecto Gutenberg y cumplir con su lema: «Rompamos las barreras de la ignorancia y de el analfabetismo.»

Michael Hart murió en septiembre de 2011, a los 40 años de iniciar su filantrópico proyecto.

Wikisource y Wikibooks

Wikilibros y Wikisource son dos proyectos hermanos de Wikipedia, ambos multilingües, nacidos en el año 2003.

Wikilibros

Wikilibros nació de una petición del editor de Wikipedia Karl Wick, que deseaba un espacio separado de Wikipedia en el que se podría escribir de forma colaborativa libros de texto y de esta manera poner libre y gratuitamente los conocimientos humanos a disposición de todos; esto permitiría luchar contra la desigualdades en la educación.

Todo el contenido de Wikilibros está disponible bajo la licencia GNU Free Documentation License o Creative Commons BY-SA. Los textos son propiedad de sus autores pero se pueden redistribuir libremente.

La edición española de Wikilibros contiene actualmente 184 libros de más de un capítulo y cerca de 5.400 páginas (la edición en inglés contiene 2.482 libros, con 43.215 pages…).

Basta con abrir la página de inicio de Wikilibros para hacerse una idea de la variedad de materias tratadas: física, química, algebra, cursos de idiomas, filosofía…

Wikisource

Wikisource es un proyecto de biblioteca digital, de acceso y redistribución libre. Disponible en más de 50 idiomas, Wikisource ofrece una gran variedad de textos: literatura, historia, filosofía, revistas… La edición española ofrece cerca de 78.000 textos, la inglesa, un poco más de 264.000.La estructura wiki es muy cómoda en el caso de Wikisource ya que permite clasificar los textos (por género, época, autor…) y facilita la navegación entre los capítulos.

Para poder formar parte de Wikisource, un documento debe cumplir ciertas características:

  • Deben haber sido publicado en papel anteriormente (salvo en dos excepciones: las publicaciones electrónicas proveniente de webs oficiales o de editoriales reconocidas, es decir que tienen una obligación de Depósito Legal en la Biblioteca Nacional de su país y las traducciones hechas para wikisource),
  • Deben pertenecer al dominio público o tener una licencia libre,
  • Deben ser objetivamente idénticos a una edición de referencia.

Las obras propuestas en Wikisource pueden ser sacadas de distintas fuentes:

El objetivo final es ofrecer una página wiki con el texto plano. En el caso de los libros digitalizados (por grandes instituciones o en casa), existe la posibilidad de visualizar la obra página por página, con el texto plano a la izquierda y la página escaneada a la derecha. Lo cual ofrece una garantía de fiabilidad sobre el contenido.

Para muchas obras Wikisource por el momento no ofrece la posibilidad de descargar las obras para poder leerlas en dispositivos electrónicos.

Podrán sorprenderse al encontrar obras de Juan Ramón Jiménez, por ejemplo, cuando este escritor murió en 1958, o sea hace menos de 70 años. Sin embargo hace más de 50 años que murió, con lo cual sus obras sí pertenecen al dominio público en países donde el derecho de autor se extiende hasta 50 años tras la muerte del autor: en Canadá y muchos países de Latino-América. En estos países por lo tanto, la redistribución y reutilización de las obras de Juan Ramón Jiménez es totalmente libre. Nosotros, en Europa, podemos disfrutar de esta oportunidad leyendo a título personal estos libros, pero en ningún caso podremos reutilizarlos: para montar una editorial y publicar estas obras, por ejemplo…
En teoría, para poder publicar un texto traducido en Wikisource, la traducción debería cumplir con los mismos requisitos que los enunciados arriba. Sin embargo, podemos lamentar que la edición española de Wikisource no sea demasiado rigurosa sobre este aspecto, entre tantos otros.

Veamos tres ejemplos: «La Vuelta al mundo en 80 días» de Jules Verne, en Wikisource en español; «Vie de Lazarille de Tormès», en Wikisource en francés; «Don Quixote», de Miguel de Cervantes, en Wikisource en inglés.

Tanto en «Vie de Lazarille de Tormès» como en «Don Quixote», vemos que se menciona el traductor al francés o al inglés de los dos libros y que un enlace nos lleva a la ficha de cada traductor, donde podemos comprobar, gracias a la indicación de su fecha de muerte, que las traducciones sí pertenecen al dominio público. Mientras que para «La Vuelta al mundo en 80 días», no hay ninguna mención sobre el traductor. Si entramos en la página de Discusión, encontramos un enlace que nos lleva a una web argentina de educación y que propone la novela en línea, pero sin mencionar el traductor.

Para un uso privado, y simplemente leer esta novela, no nos supone ningún problema, pero tengamos en cuenta que muy probablemente, esta traducción estará todavía bajo copyright y, además de no cumplir con las normas de Wikisource, su puesta en línea supone la misma infracción a la Ley sobre Propiedad Intelectual que el hecho de colgar la última película de Woody Allen en Youtube.

Sería muy aconsejable que Wikisource en español, al ser un idioma masivamente hablado en todo el planeta, fuese más rigurosa en la publicación de obras traducidas. Es preferible que haya menos obras, pero con la garantía total de que sean libres de derechos, que proponer obras de procedencia dudosa susceptibles de vulnerar la ley…

Biblioteca Virtual Miguel de Cervantes y Biblioteca Virtual Lluís Vives

La Biblioteca Virtual Miguel de Cervantes fue lanzada en 1999 a iniciativa de la Universidad de Alicante. Pionera de las bibliotecas digitales en España, su objetivo es la difusión de la cultura hispánica, mediante el acceso gratuito en línea de libros, estudios críticos y de investigación, materiales históricos, periódicos y revistas, audiovisuales, archivos sonoros, vídeos en lengua de signos española…

Desde el año 2001 la gestiona la Fundación Biblioteca Virtual Miguel de Cervantes y su fondo se eleva a más de 83.000 materiales de diversos formatos.

El catálogo está estructurado en distintas áreas, representadas por sus portales respectivos: Literatura, Lengua, Historia, Biblioteca Americana, Biblioteca de Signos, Biblioteca Joan Lluís Vives, Biblioteca Letras Galegas y Literatura Infantil y Juvenil.

Cada portal está dividido en subsecciones, lo cual hace la navegación muy fácil e intuitiva: si por ejemplo queremos obtener información sobre Gustavo Adolfo Bécquer, entraremos por Literatura Española, luego iremos a Bibliotecas de autor, para al final seleccionar la opción Gustavo Adolfo Bécquer. Una vez en la Biblioteca de autor Gustavo Adolfo Bécquer, podemos leer información biográfica sobre el autor, ensayos sobre su obra, sus obras mismas, pero también podemos encontrar grabaciones sonoras de algunos cuentos y poesías, o ver imágenes relacionadas con el autor de las «Leyendas»…

La Biblioteca Virtual Miguel de Cervantes no solo ofrece Bibliotecas de autor de autores muertos desde hace más de 70 años y cuyas obras forman por lo tanto parte del dominio público, sino que dedica espacio a autores más recientes, como Rafael Alberti, Rafael Azcona o Mario Benedetti… En este caso, se ofrece información biográfica y bibliográfica sobre el autor, y a veces, se pueden leer extractos de sus obras: al estar todavía protegidas por el copyright, ha sido necesario llegar a un acuerdo entre el autor o sus herederos para poder publicar algo.

Resulta interesante navegar por los portales temáticos que ofrecen espacio a géneros literarios en concreto. Por ejemplo, para los amantes de la novela gótica, no se pierdan el portal dedicado a este género tan peculiar, donde encontrarán un abanico de obras estremecedoras, tanto españolas como obras traducidas de la literatura europea.

En sus inicios, las obras disponibles en la Biblioteca Virtual Miguel de Cervantes no se podían descargar: sólo era posible el acceso en línea y página por página (no se podía leer un libro en modo de desplazamiento vertical: había que hacer clic cada vez que se quería cambiar de página). Más recientemente, han empezado a proponer el acceso a las obras en formato pdf, lo que permite una lectura más cómoda, además de autorizar la descarga.

Hermanita de la Biblioteca Virtual Miguel de Cervantes, la Biblioteca Virtual Lluís Vives es fruto de un convenio entre la Fundación Biblioteca Virtual Miguel de Cervantes y la red de universidades que forman el Institut Joan Lluís Vives (al que pertenece la Universitat Jaume I). Su objetivo es la difusión de la cultura catalana, valenciana y balear mediante la publicación por Internet de sus obras más representativas.

Su estructura y su funcionamiento están calcados sobre los de la Biblioteca Virtual Miguel de Cervantes. Podemos encontrar, entre otros, una Biblioteca de autor dedicada a Ausiàs March, o un portal temático sobre Al Tall

Google books

En el corazón de la polémica desde su lanzamiento hacia 2004, el proyecto Google Books está en la mente de los creadores de Google desde sus inicios. En realidad, fue el punto de partida de la creación del motor de búsqueda que todos conocemos. En 1996, los dos fundadores de la empresa, Sergey Brin y Larry Page, trabajaban sobre un proyecto de investigación financiado por el Stanford Digital Library Technologies Project, con el objetivo de construir una biblioteca digital (por aquella época, el Proyecto Gutenberg estaba en pleno auge). Trabajan sobre la idea de un robot que permitiera indexar los libros y analizar las conexiones entre ellos. Este trabajo servirá de base al algoritmo PageRank que utiliza el motor de búsqueda de Google.

En el año 2002, el proyecto «libros» vuelve a ser de actualidad en Google. Sus investigadores visitan las grandes bibliotecas digitales (Library of Congress, Gutenberg) y deciden concentrar sus esfuerzos en desarrollar un sistema que permita acelerar considerablemente el proceso de escaneado de los libros y de reconocimiento de caracteres, sin perjudicar la calidad final.

El proyecto se anuncia en octubre del 2004, bajo el nombre de Google Print: su objetivo es, mediante convenios entre diversas bibliotecas universitarias y la New York Public Library (la biblioteca pública de Nueva York), poner en línea, en un plazo de 10 años, 15 millones de libros. Inicialmente, el proyecto sólo abarcaría obras pertenecientes al Dominio Público y las bibliotecas serían las que seleccionarían los libros. Google se encargaría de escanear las obras, quedándose con una copia y dejando otra a la biblioteca, en el caso de que quiera crear su propia biblioteca digital separada de Google Books.

A partir de 2005, Google Print cambia su nombre por Google Book Search, se multiplican los convenios con nuevas bibliotecas en Estados Unidos y se inician contactos en países de Europa: Alemania, Francia, Austria, España, Bélgica, Italia y Holanda. Además de las obras pertenecientes al Dominio Público, se negocian acuerdos con los editores para empezar la digitalización de libros todavía sujetos al copyright. La idea es, en este caso, no proponer el acceso libre a la obra, sino un acceso de pago, sin el cual sólo se podría visualizar los datos bibliográficos del libro, y tres extractos cortos.

Las polémicas y pleitos en torno a Google Books desde sus inicios son bastante inextricables y se basan sobre sutilidades judiciales. Básicamente, los pleitos más importantes que le hicieron a Google sobre este proyecto se debieron a que los editores denunciaban el hecho de que Google digitalizaba sus obras todavía sujetas al copyright y las ponían en línea sin haber obtenido su acuerdo. La defensa de Google era que sólo se ponían extractos de estas obras y el gigante americano se apoyaban sobre un concepto legal tolerado en Estados Unidos: el fair use (uso legítimo u uso razonable). Este concepto del derecho anglosajón autoriza un uso limitado de obras protegidas, sin necesidad de pedir permiso, para usos académicos o informativos. El fair use permite por lo tanto citar una frase de un libro o utilizar una foto, aunque estén sujetos al copyright.

En 2011 y 2012, con más de 20 millones de obras digitalizadas, el proyecto ha evolucionado en una plataforma de compra de libros electrónicos para dispositivos móviles, centralizado actualmente bajo el nombre de Google Play. Esto habrá permitido aclarar los asuntos legales y lograr los acuerdos necesarios con las editoriales.

Al margen de su vertiente comercial, Google Books es todavía una fantástica fuente de libros antiguos, pertenecientes al Dominio Público (aunque no están indexado como tales, sino como «Google ebook gratuito»), a los que podemos acceder libre y gratuitamente, para la lectura en línea y la descarga.

Las búsquedas de libros en Google Books se hacen de la misma manera que en Google. El gran interés de este buscador es que los libros están disponibles en línea bajo dos formatos: el modo «Imágenes de página», que nos muestra facsímiles de las páginas digitalizadas del libro original, y el modo «Versión de texto» que nos permite ver únicamente el texto plano. Al estar disponible el texto plano, las búsquedas se hacen no sólo sobre el título, autor, materia, etc, sino dentro de los libros, lo cual permite llevar a cabo investigaciones muy avanzadas.

Por ejemplo, dos investigadores de la Universidad George Mason en Estados Unidos han analizado cómo más de dos docenas de palabras — entre ellas «dios», «amor», «trabajo», «ciencia» y «industrial» — aparecen en títulos de libros británicos - disponibles en bibliotecas digitales - desde la Revolución francesa en 1789 hasta el comienzo de la Primera Guerra Mundial en 1914. Su objetivo es estudiar la forma de pensar - en particular su fe en la ciencia y el progreso - de los británicos de la época victoriana. Este proyecto fue patrocinado por Google… (Referencia: ¿Hacia un análisis computarizado de la literatura? artículo publicado en Revista Ñ el 09 de diciembre de 2010).
Sobre este aspecto, la Biblioteca Municipal de Lyon, una de las primeras bibliotecas municipales en participar en Google Books se quejó de que Google se reserva una exclusividad de 25 años sobre la indexación de las obras y las versiones de texto: las Bibliotecas involucradas sólo pueden ofrecer a su público las digitalizaciones facsímiles de los libros, y para acceder a la búsqueda en el texto, hay que pasar por Google

Los libros disponibles en Google Books se pueden descargar en formato pdf, y en algunos casos, en formato ePUB, para su lectura en lectores electrónicos. Desgraciadamente, el reconocimiento de caracteres no está muy cuidado y si intentamos descargar un fichero ePUB, es muy probable que no podamos leerlo: veremos que se quedan muchos caracteres mal reconocidos y transcritos por signos de puntuación o letras equivocadas y que los encabezados y pies de página no han sido eliminados del texto: como se trata de texto plano, la tipografía no permite diferenciar los encabezados y pies de página, y nos los encontramos en el lugar que físicamente ocupaba en el documento original, a menudo, en medio de una frase…

Tabla comparativa de las informaciones legales en algunas bibliotecas digitales

Como ya hemos visto anteriormente, los fondos de muchas bibliotecas digitales españolas se encuentran accesibles desde Europeana, bien directamente, bien a través del portal HISPANA del Ministerio de Cultura. No vamos a estudiarlas por separado, pero les proponemos este resumen comparativo de las Bibliotecas Digitales que más cerca tenemos…

NombreInstituciónÁmbitoMaterialesMenciones legales
Biblioteca Digital HispánicaBiblioteca Nacional de EspañaNacionalLibros, Manuscritos, Dibujos, Grabados y Fotografías, Material cartográfico, Material cartográfico manuscrito, Música impresa, Música manuscrita, Registro sonoro no musical, Registro sonoro musical, Prensa y RevistasLos contenidos y cualquier creación intelectual existente en este sitio, así como el propio sitio en su conjunto como obra artística multimedia, están protegidos como derechos de autor por la legislación en materia de Propiedad Intelectual. El usuario queda expresamente autorizado por la Biblioteca Nacional a visualizar, imprimir, copiar o almacenar cualquier contenido, siempre que ello se efectúe para fines personales y privados del usuario, sin finalidad comercial, de distribución o difusión en línea y sin modificar ni alterar los antedichos contenidos.
Hemeroteca DigitalBiblioteca Nacional de España (Forma parte de la Biblioteca Digital Hispánica)NacionalPrensa y Revistasid.
Biblioteca Valenciana Digital (BIVALDI)Biblioteca ValencianaAutonómicoLibrosRepositorio Open Archive Initiave → promociona el libre acceso a los documentos. En Europeana, cada documento procedente de BIVALDI lleva una etiqueta sobre sus condiciones legales.
Memòria Digital de Catalunya (MDC)Repositorio cooperativo impulsado por las universidades de Cataluña y la Biblioteca de Catalunya, coordinado por el Consorci de Biblioteques Universitàries de Catalunya (CBUC)Autonómico / UniversitarioFotografías, Dibujos, Mapas, Carteles, Folletos, Incunables, Música impresaTodos sus contenidos son propiedad del CBUC, o de terceros que hayan autorizado el uso a éstos. Los documentos incluidos en el repositorio MDC son propiedad de las instituciones editoras pero los actos de reproducción, comercialización, comunicación pública o transformación total o parcial de la web necesita el consentimiento expreso y escrito de éstos. Cada obra lleva su propia información legal, según los criterios de Europeana.
Biblioteca Digital de CastellóUniversitat Jaume IUniversitarioLibros, Prensa y Revistas, Imágenes, Grabaciones sonoras, MapasTots els drets reservats, excepte per a les obres ja en domini públic i les obres amb Llicència Creative Commons. Cada obra lleva su propia información legal, según los criterios de info-eu-repo (unos descriptores utilizados en Bibliotecas Europeas de Investigación) (Descripción de los criterios posibles)
SomniUniversitat de Valencia (Forma parte de RODERIC, Repositori d'Objectes Digitals per a l'Ensenyament la Recerca i la Cultura)UniversitarioLibros antiguos, Incunables, ManuscritosRODERIC respon al compromís de la Universitat amb el moviment d'accés obert al coneixement adquirit amb la seua adhesió a la Declaració de Berlín (30 Setembre de 2008). Cada obra lleva su propia información legal, según las licencias Creative Commons.
Hemeroteca del Archivo Municipal de CastellónArchivo Municipal de CastellónMunicipalPrensa y RevistasNo se especifica.
Ejercicio.

La novela filosófica «Zadig» de Voltaire se puede encontrar en distintos idiomas (español, inglés, francés) en Google Books y en Proyecto Gutenberg. Busquen estas distintas versiones en los dos repositorios y comparen, para un mismo idioma, la «Versión de texto» de Google Books y el texto en línea de la vista HTML en Proyecto Gutenberg. ¿Cual sería la mejor opción para descargarse la novela y leerla en un lector electrónico?

Ejercicio.

El blog de la Biblioteca Municipal de Vila-real, escrito por Christine Sétrin de manera trimestral ofrece una recopilación temática de libros especialmente interesantes pertenecientes al dominio público y disponibles en Internet. Se trata de un paseo guiado por un tema. A leer y releer: Tesoros Digitales

Audiolibros

«Al abrir el forro, me encontré un no sé qué de metal, una maquinaria algo parecida á la de nuestros relojes, llena de resortes y de muelles casi imperceptibles. Era un libro, en verdad, pero un libro milagroso, pues carecía de hojas y de letras; para aprender en semejante libro no hacen falta los ojos: bastan los oídos. El que quiere leer da cuerda a la máquina cuidadosamente, hace girar una aguja sobre el capítulo que desea escuchar, y al momento sale el capítulo como de una boca humana, o de un instrumento de música susceptible de producirlos diferentes sonidos que sirven en la Luna para expresión del lenguaje…» Cyrano de Savinien de Bergerac (1619-1655) - «Historia cómica, o Viaje a la luna» (1657, traducción de Nicolás Estévanez de 1902). (Texto en francés)

A continuación Cyrano de Bergerac explica que los habitantes de la luna solían viajar con varios de estos artilugios colgados de la silla de su caballo, y así poder escuchar capítulos de los libros mientras viajaban… Han tenido que pasar más de 300 años para que el sueño de Cyrano se hiciera realidad, gracias a los audiolibros…

Ilustración : Albert Robida - «Littérature phonographique pour la promenade» (1894), ilustración para el cuento «La Fin des livres» de Octave Uzanne (Wikimedia Commons).

Todos hemos conocido estos cuentos que los niños escuchaban en un disco de vinilo o una casete al mismo tiempo que lo leían en el libro de acompañamiento. También hemos podido escuchar CD's de escritores o poetas leyendo sus propios poemas o cuentos. Pero eso se quedaba en obras cortas y no existían novelas enteras… Los formatos digitales de grabaciones sonoras, más «compactos» (mp3, ogg) han permitido dar un paso adelante en este tema: la grabación de libros completos (novelas, ensayos…). Efectivamente, con el Compact Disc tradicional, no se podía ni siquiera imaginar grabar una novela como «Robinson Crusoe» (unas 24 horas de lectura) y menos aún el «Quijote» (¡44 horas!). Ya que un CD tiene una capacidad inferior a 1 hora, harían falta 24 CD's para «Robinson Crusoe» y 44 para el «Quijote»… Con el mp3, ya no tenemos límite de tiempo o de capacidad: si no nos cabe todo el libro en el lector mp3 («Robinson» ocupa unos 500 Mb y «Quijote», 1200 Mb), pero podemos ir descargando los capítulos y borrar los que ya hemos leído, a medida que vamos avanzando en la novela.

Al mismo tiempo que la industria editorial empezó a interesarse por esta nueva posibilidad, se han desarrollado nuevas iniciativas colaborativas que parten de la misma idea: crear bibliotecas digitales de audiolibros libres basados en obras pertenecientes al dominio público… El audiolibro es un perfecto ejemplo de producto derivado de una novela perteneciente al dominio público.

Las dos webs que presentaremos a continuación tienen un funcionamiento muy parecido: donantes de voz voluntarios se dedican buscar obras pertenecientes al dominio público en los repositorios y bibliotecas digitales que ya conocemos y a grabarse leyendo en voz alta textos literarios, filosóficos e incluso científicos («El Origen de las especies» de Charles Darwin, por ejemplo). Estas grabaciones se pasan a formato mp3, u ogg, y se mandan al sitio web que distribuye los audiolibros: se prepara una ficha descriptiva del libro en la que figuran un breve resumen, el tiempo total de lectura, el nombre del o de los donantes de voz que han participado y los enlaces necesarios para poder descargar los ficheros mp3.

El acceso es totalmente libre, legal y gratuito. Cualquiera puede descargarse los libros, pasárselos al lector mp3, y disfrutar «audioleyendo» grandes clásicos de la literatura mientras van a caminar, al gimnasio, planchando la ropa y cocinando…

Librivox

LibriVox fue pionera. Fue creada en 2005 a la iniciativa del escritor norteamericano Hugh McGuire. La primera obra grabada y puesta gratuitamente a disposición del público fue grabada por McGuire mismo y once voluntarios; era «The Secret Agent» de Joseph Conrad. Muy rápidamente, creció el número de voluntarios y de obras grabadas… para llegar a tener actualmente más de 5200 obras propuestas. Su objetivo es «to make all books in the public domain available, for free, in audio format on the internet». Los audiolibros propuestos en LibriVox están publicados con licencia «Public Domain», lo cual autoriza una total redistribución y una plena difusión de estas obras. Por ejemplo, esta licencia permite a numerosas bibliotecas públicas grabar CDROM's o CD's con audiolibros descargados de LibriVox, y proponerlos en préstamo a sus usuarios que no tienen acceso a Internet en casa…

Litteratureaudio

Littérature audio, sin duda muy inspirada por el modelo americano de LibriVox, es una iniciativa francesa, lanzada en 2007 por dos estudiantes, Augustin Brunault y Clément Pitton. Los primeros textos propuestos fueron textos de filosofía (Seneca, Rousseau y Montaigne), grabados por Brunault, entonces estudiante en filosofía…Littérature audio cuenta actualmente con 3000 audiolibros que abarcan una amplio abanico, desde cortos poemas a largas novelas como «Ana Karenina» o «Los últimos días de Pompeya»… Hay que mencionar la gran cantidad de libros grabados en tan poco tiempo se debe a un donante de voz particularmente prolífico: un señor de 91 años, René Depasse, profesor de francés jubilado desde hace… unos cuantos años, que dedica unas 6 o 7 horas diarias a la lectura y grabación de nuevas obras: él solo suma casi 1400 audiolibros… Los audiolibros propuestos se pueden descargar libre y gratuitamente y cada vez son más los donantes de voz que optan por especificar que sus creaciones se publican bajo licencias Creative Commons.

Tanto LibriVox como Littérature audio efectúan una selección de los donantes de voz antes de publicar sus grabaciones: los candidatos deben grabar cortos ensayos y someterlos a la aprobación de los moderadores. Para ser aprobados, las grabaciones deben cumplir ciertas características técnicas, que garantizarán una escucha óptima.

La financiación de las dos webs, que permite pagar y mantener los servidores informáticos que almacenan los libros, se hace esencialmente mediante donativos, aunque Littérature audio también recibe dinero de discreta publicidad en sus páginas.

¿Y en español, qué? LibriVox ofrece unos 70 libros en español y… dos en catalán. El fondo en español se está ampliando progresivamente. Littérature audio también dispone de algunos cuentos y poemas.

La Biblioteca Virtual Miguel de Cervantes ofrece la posibilidad de escuchar audiolibros en streaming, pero no están previstas las descargas.

La ONCE también dispone de un fondo importante de audiolibros para descargar, de libros clásicos y novedades (al ser destinados a personas con minusvalías visuales, están exentos de pagar derechos de autores para grabar audiolibros de novelas recientes) pero están destinados exclusivamente a los socios de la institución.
public/docencia/univmajorsculturalibre/tema7.1354523116.txt.gz · Última modificación: 2012/12/03 08:25 por boronat