Tabla de Contenidos
Grandes repositorios multimedia
Un poco de historia...
Todo esto remonta a la Antigüedad, en concreto, al siglo III antes de nuestra era. El rey Ptolomeo I de Egipto decidió hacer de Alejandría la capital cultural de su reino y del mundo helenístico. Manda contruir un museo que albergará una universidad, una academia y una biblioteca. El objetivo de esta biblioteca, contruida en el año 288 antes de nuestra era, consistirá en almacenar en un mismo lugar todo el conocimiento universal… Ptolomeo I ordena que todos los libros contenidos en los barcos que llegan al puerto de Alejandría sean copiados y traducidos (la Biblioteca se queda con el original y el barco con una copia), se compran o copian obras de diversas procedencias ; e incluso la leyenda dice que el sucesor de Ptolomeo I, Ptolomeo II, pidió a todos los reyes y grandes del mundo que mandarán las obras de todas las categorías de autores de sus regiones. En época de Julio César (100 a.C.-44 a.C.), la Biblioteca de Alejandría alcanzaba los 700.000 volúmenes. No se sabe si fue consecuencia de las guerras entre César y Pompeyo, o si fue a raíz de unos conflictos entre paganismo y cristianismo en el siglo III, o si fue por la conquista árabe en la Edad Media temprana, pero lo cierto es que la Biblioteca de Alejandría fue destruida y su fabuloso fondo desapareció.
Durante siglos, los libros y las bibliotecas fueron privilegio de unos pocos, hasta que Gutenberg inventó la imprenta (su primer libro impreso fue una Biblia, en 1457), lo que permitió popularizar el acceso a los libros. Pero aún así, las bibliotecas eran espacios privados, reservados, a los que sólo podían acceder unos pocos.
Ilustración: Una escena de « Los Desposados » de Alessandro Manzoni, en la que aparece el Cardenal Federico Borromeo (Wikimedia Commons).
Ilustración: Melvil Dewey (Wikimedia Commons).
A finales del siglo XIX, los bibliotecarios de todo el mundo empiezan a preocuparse por organizar los fondos de sus bibliotecas y sobre todo universalizar esta organización. Empiezan a ver la luz los sistemas de clasificación de los fondos bibliográficos: la idea consiste en dividir el conocimiento en diversas ramas y asignar a cada rama y sus subdivisiones, un código. Si se clasificaran los fondos de todas las bibliotecas del mundo siguiendo este sistema, un mismo libro se clasificaría de la misma manera, que se encuentre en una biblioteca de Nueva York, de Madrid o de Pekín. En 1876, Melvil Dewey crea el Sistema Dewey de Clasificación, que los belgas Paul Otlet y Henri La Fontaine retomarán y mejorarán en 1895, para crear la Clasificación Decimal Universal. Los dos sistemas se han ampliado con el paso de los años, pero todavía hoy están en uso… (en la biblioteca de la UJI se utiliza otro sistema de clasificación, el de la Biblioteca del Congreso de Estados Unidos, más adaptado a los fondos de una biblioteca universitaria). Durante el siglo XX, se ha ido uniformizando toda una normativa internacional para la catalogación de las obras. Todo eso, combinado con el auge de Internet, ha permitido llegar a la creación de catálogos colectivos de bibliotecas, organizadas en redes: universitarias, públicas, nacionales…, estos catálogos agrupan las descripciones bibliográficas de las obras que incluyen y se pueden consultar en línea desde cualquier lugar del mundo. La creación de catálogos colectivos de bibliotecas ya constituía un gran paso hacia una nueva Biblioteca de Alejandría, receptáculo de todo el saber humano: una Biblioteca de Alejandría distribuida, repartida por todo el mundo, pero que permite localizar muy fácilmente cualquier volumen.
El siguiente gran paso llegó a principios del siglo XXI: la digitalización de las obras y su puesta en línea, libre y gratuitamente. Es lo que veremos a continuación.
Wikimedia Commons
Proyecto hermano de Wikipedia, Wikimedia Commons se creó en 2004. El objetivo inicial era de tener un banco de imágenes común que pudieran utilizar los colaboradores de Wikipedia de los distintos países, sin tener que «subir» la misma imagen cada vez que se traduce un artículo a un nuevo idioma. Pronto se convirtió en una referencia, gracias notablemente a su crecimiento exponencial: de 100.000 ficheros almacenados a sus inicios en 2004, alberga actualmente unos 14 millones de imágenes (cuadros, fotografías, grabados, ilustraciones…), grabaciones sonoras, textos y vídeos.
La particularidad de Wikimedia Commons es que todos los materiales almacenados pertenecen al dominio público o están publicados bajo algún tipo de licencia libre. Lo cual significa que cada cual puede gratuitamente copiar, reutilizar o modificar estos materiales, siempre que respetan las condiciones de redistribución de esos ficheros.
La tecnología wiki que da, como a Wikipedia, su estructura a Wikimedia Commons, garantiza un uso sencillo tanto a los navegantes como a los colaboradores que pueden añadir nuevos materiales sin tener conocimientos especiales.
Podríamos decir que Wikimedia Commons se compone de tres tipos de elementos básicos: los ficheros llamados media (imagen, sonido o vídeo básicamente), las páginas (page) y las categorías (category).
Por ejemplo, en relación con Miguel de Cervantes, podemos encontrar:
- distintos retratos de este autor (por ejemplo, este grabado de 1742 o el famoso retrato de Cervantes por Juan de Jáuregui), o páginas e ilustraciones sacadas de libros antiguos (esta portada de «Los Trabajos de Persiles y Sigismunda»)
- una página dedicada a Cervantes que nos presenta, bajo distintos conceptos (Retratos, Monumentos…) los ficheros más destacados en torno a este autor.
- una categoría que centraliza toda la información disponible en Wikimedia Commons sobre Cervantes: se compone de subcategorías (Cervantes in art, Books by Miguel de Cervantes) que nos permitirán acceder a más ficheros, de un acceso a la página citada en el punto anterior y de unos primeros ficheros.
Cuando se realiza una consulta en el buscador, al teclear las primeras letras de un criterio de búsqueda, el sistema va proponiendo títulos de páginas disponibles en Wikimedia Commons. Por ejemplo, Madrid. Accedemos directamente a la página dedicada a la capital: en la que encontramos una selección de las imágenes más destacadas, fotos, mapas, cuadros. Si, al final de la página, seleccionamos la categoría Madrid, entraremos en la sección que contiene «todo lo que hay» sobre la ciudad, agrupado en subcategorías : Madrid in art, Videos from Madrid, Manzanares River… Según lo que busquemos, podremos ir a una subcategoría u otra.
Internet Archive
Internet Archive es una asociación sin ánimo de lucro, creada en California en 1996 por Brewster Kahle y dedicada al archivado de sedes web: es decir que de forma periódica, se realiza una copia de las sedes web de todo el mundo y se archivan estas instantáneas. A partir de 1999, Internet Archive fue ampliando sus contenidos a otros tipos de materiales, como libros, sonido, vídeos, software…, con el fin de lograr el almacenamiento de todo el conocimiento humano, siguiendo la idea de la Biblioteca de Alejandría (de hecho, tiene acuerdos para albergar un «espejo» de sus contenidos, con la flamante Bibliotheca Alexandrina, inaugurada en Alejandría en el año 2002). Desde 2001, esta colección está accesible libre y gratuitamente. En su mayoría, estos materiales forman parte del dominio público o están difundidos bajo licencias Creative Commons permitiendo su redistribución.
Más de 3.600.000 libros, 1.300.00 grabaciones sonoras, 700.000 vídeos, 42.000 programas de ordenador, sin contar los 150 mil millones de web archivados, componen este fondo que ha sido reconocido oficialmente como biblioteca por el Estado de California.
- Wayback Machine es el nombre de la sección dedicada al archivado de sedes web. Como anécdota, saca su nombre de una serie televisiva de dibujos animados en la que aparecía una máquina del tiempo llamada WABAC Machine y que servía para describir los grandes acontecimientos históricos. La frecuencia de captura de instantáneas no es fija. Pueden transcurrir hasta varias semanas entre dos capturas. Las copias permanecen disponibles en línea entre 6 y 12 meses. Existe una modalidad bajo suscripción, llamada Archive-it, que permite a los propietarios y autores de sedes web almacenar diariamente sus contenidos. Mencionaremos que estos archivos están siendo utilizados por la justicia como elementos decisivo en ciertos pleitos sobre violación de copyright o de patentes…
- Los libros vienen en su mayoría de fondos emblemáticos como los del Project Gutenberg o de Google Books (sobre los que volveremos más adelante) y de Bibliotecas Públicas de Estados Unidos y Canadá; por otra parte, diversos organismos de todo el mundo colaboran con Internet Archive compartiendo sus fondos: entre otros, podemos nombrar la Biblioteca de la Universidad de Pekín o el proyecto Million Book Project, que reúne diversas instituciones de la India, China y Egipto dedicadas a la digitalización de fondos. La gran ventaja que posee el fondo bibliográfico de Internet Archive, es que muchos libros están escaneados en color, lo cual resulta muy interesante en el caso de los libros ilustrados. Por ejemplo, el famoso libro más caro del mundo (cierta edición de este libro se vendió en subasta este año por el módico precio de 10 millones de dólares), «The Birds of America», de John James Audubon, ilustrado por numerosos grabados a todo color de pájaros o los libros de la sección Children's Library, por ejemplo, este precioso «Mago de Oz» en inglés…
Ilustración: Frank Baum - «The Marvellous Land of Oz» (1904).
- Muchos de los vídeos han sido proporcionados por cadenas de televisión, pero también por los propios internautas. En la sección de Moving images (vídeo y películas), son de destacar:
- las colecciones de películas mudas antiguas, en las que encontraremos el mítico «Viaje a la luna» de George Méliès (1902) o 60 películas de Segundo de Chomón (1871-1929), director español afincado en París,
- la colecciones de dibujos animados, por ejemplo Film Chest Vintage Cartoons, casi 90 dibujos animados clásicos de los años 1930 y 1940, o Animation Shorts, 1000 películas de animación de distintas épocas…
- y varias colecciones de cine antiguo en las que encontramos tesoros como los primeros Hitchcock («Los 39 escalones» (versión de 1935) o «El anillo» (1927)) o el «Nosferatu» de F.V. Murnau…
- Programas de radio, audiolibros, conciertos en directo de artistas independientes, discos antiguos componen el fondo sonoro de Internet Archive, además de todo tipo de grabaciones propuestas por los internautas. La colección 78 RPM's & Cylinder recording se compone de casi 13.000 discos antiguos de 78 revoluciones y grabaciones con cilindro. (Olimpia Boronat - Rigoletto, grabación de 1908; un album de los años 1930 de Fred Astaire; las canciones de Maurice Chevalier de los años 1929-1934)…
Como muchos tesoros, los que están almacenados en los fondos de Internet Archive suelen ser bastante difíciles de encontrar. Al ser el fondo tan extenso, muchas veces cuando realizamos una consulta, no encontramos con que o bien no encontramos nada o el sistema nos devuelve una multitud de resultados entre los que no sabemos elegir… Las palabras clave de materias y las autoridades de autor no parecen tener mucha homogeneidad; por ejemplo, volviendo a Cervantes, podemos encontrar la forma normalizada «Cervantes de Saavedra, Miguel de», pero tambien, en algunos registros está introducido como «Miguel de Cervantes y Saavedra». Otra dificultad es que el buscador, contrariamente a buscadores como Google por ejemplo, distingue las letras acentuadas de las que no lo son. Busquemos el poeta francés Stéphane Mallarmé, tecleando «mallarme» y luego «mallarmé» y veremos que los resultados obtenidos no son idénticos en los dos casos (mientras que en Google encontraríamos lo mismo en los dos casos)…
Bibliografía
- Necesitamos muchas bibliotecas, por Brewster Kahle.
En resumen:
- todo lo publicado antes de 1923 forma parte del dominio público,
- todo lo publicado antes del 1 de enero de 1964 sin haber renovado el copyright, forma parte del dominio público,
- todo lo publicado antes del 1 de marzo de 1989 sin mencionar derechos de autor (ausencia de los símbolos « © », «Copyright» o «Copr.», seguidos del año de publicación y del nombre del que explota o detenta el copyright),
- en el resto de casos, el copyright tiene una duración de 70 años después de la muerte del autor o 95 años desde la publicación de la obra en el caso de obras colectivas o registradas bajo un nombre de empresa.
Europeana
Europeana vio la luz en 2008, como iniciativa de la Comisión Europea. Fue el lanzamiento ese mismo año 2008 del proyecto de Google, Google Books, que llevó a los dirigentes europeos a interrogarse sobre la conservación y la divulgación del patrimonio cultural europeo y a plantear la idea inicial de una puesta en común de los recursos digitalizados por las bibliotecas nacionales de los Estados Miembros. Poco a poco, se han ido asociando al proyecto otras instituciones de todo tipo: bibliotecas universitarias, regionales y municipales por supuesto, pero también museos o centros de investigación. Alrededor de 1500 instituciones han participado con Europeana desde su creación. Entre ellas, mencionaremos, además de la Biblioteca Nacional de España (que tiene su propia biblioteca digital a la que podemos acceder por separado, la Biblioteca Digital Hispánica); bibliotecas de comunidades autónomas, la Biblioteca Valenciana Digital (BIVALDI) por ejemplo; o HISPANA, iniciativa del Ministerio de Educación, Cultura y Deportes, que «reúne las colecciones digitales de archivos, bibliotecas y museos de España, conformes a la Iniciativa de Archivos Abiertos que promueve la Unión Europea» que contiene en total casi 2.900.000 objetos digitales de 174 repositorios (por ejemplo, la Biblioteca Digital de Castellón de la Universitat Jaume I).
El prototipo de Europeana que se presentó en 2007 se componía de 12000 documentos digitalizados. Cinco años después, podemos acceder a más de 20 millones de obras: libros, ilustraciones, grabaciones sonoras o vídeos, procedentes de toda Europa.
Recientemente (Septiembre 2012), la Comisión Europea a anunciado que los meta-datos de Europeana estarán disponibles a partir de ahora bajo la licencia Creative Commons - Public Domain, lo cual permite a cualquiera copiar y reutilizar libremente estos meta-datos. Pero, los meta-datos no son las obras: sólo son los datos bibliográficos, o sea, las fichas descriptivas de las obras. En nuestro país, se ha difundido la noticia como que eran las obras las iban a formar parte del dominio público… (Noticia de ABC del 15 de septiembre: Se libera el acceso a los archivos de Europeana).
En realidad, muchos de los materiales accesibles desde Europeana forman parte del dominio público, pero se pueden encontrar obras que sólo se pueden consultar previo pago (por ejemplo, las grabaciones sonoras proporcionadas por DISMARC, una agrupación austriaca de discográficas). Cada centro, en función del material presentado, determina sus condiciones de acceso, las cuales vienen especificadas en las fichas de las obras en Europeana (en el apartado Rights en la columna de la izquierda).
Europeana no es más que un motor de búsqueda, accesible en los 21 idiomas oficiales de la Unión Europea, que facilita y centraliza el acceso a los documentos en las bibliotecas digitales que participan; pero no almacena los documentos digitalizados. Por lo tanto, cuando efectuamos una búsqueda en Europeana, consultaremos el documento final desde la biblioteca digital de la institución a la que pertenece la obra.
Para hacernos una idea de los materiales que podemos encontrar en Europeana, de su procedencia, de las diferencias en las menciones legales y de cómo se accede al documento final, vamos a estudiar lo que nos podemos encontrar sobre un autor valenciano: Vicente Blasco Ibáñez. Nuestro gran escritor murió en 1928, o sea hace más de 70 años, con lo cual sus obras ya forman parte del dominio público. Introducimos «Blasco Ibáñez» (con acento en la a de Ibáñez) en la herramienta de búsqueda y vemos que obtenemos un centenar de resultados. Entre todos ellos, destacaremos:
- Toda una serie de novelas, por ejemplo «La Barraca», que vienen de la Biblioteca Valenciana Digital (BIVALDI). La ficha de Europeana nos indica que esta novela forma parte del Dominio Público. Podemos hacer clic sobre la imagen e iremos a la Biblioteca Valenciana Digital (BIVALDI). Allí, el pequeño logotipo de documento pdf nos permite no solo abrir el libro, sino descargarlo.
Ilustración: Vicente Blasco Ibáñez - «La Barraca» (1919).
- «Ce que sera la République Espagnole», un ensayo de 1925, traducido al francés, también etiquetado como formando parte del Dominio Público. Al hacer clic sobre la imagen, leeremos el libro en Gallica, donde no solo podemos leerlo en línea, sino que lo podemos descargar (arriba a la derecha: «Descargar / De impresión»; la versión en español de Gallica suele dar alguna sorpresa lingüística…).
- « Arènes sanglantes », traducción al francés de «Sangre y arena»; también nos indican que forma parte del Dominio Público, pero esta vez, el documento está almacenado en el fondo de la Biblioteca Digital de Castilla y León, la cual nos permite leer el libro en línea, pero no podemos ni descargar ni imprimir: los iconos del Disquete o de la Impresora sólo sirven para guardar una copia en formato imagen (jpg) o imprimir la página en curso.
- Un retrato fotográfico de Vicente Blasco Ibáñez, propiedad de la Biblioteca Nacional de España, con una enigmática mención de Free Access con copyright… La sorpresa viene cuando intentamos acceder a la foto. Hacemos clic sobre ella y nos encontramos con una página de meta-datos, con URL de la Biblioteca Nacional, pero no podemos ver la imagen. Tendremos que acceder a la Biblioteca Digital Hispánica y volver a realizar la búsqueda para poder ver mejor esta foto y guardarla si nos apetece.
Otros repositorios de interés
- Library of Congress Digital Collections: desde 1994, la Librería del Congreso de Washington digitaliza sus fondos y los ofrece en acceso gratuito. Esencialmente dedicada a la historia de Estados Unidos, con secciones como American Memory o Historic Newspapers, también tiene colecciones variadas como International Collections (con fondos sobre las culturas de todo el mundo), Performing Arts (grabaciones de conciertos, obras de teatro…) o Early Sound Recordings (10.000 discos de 78 revoluciones digitalizados que se pueden escuchar en línea)…
Recientemente, se ha descubierto que la primera máquina del tiempo de la literatura no era la que imaginó H.W. Wells, sino que era… española. Se llamaba «El Anacronópete», y es la protagonista principal de una novela del mismo nombre, escrita en 1887 por Enrique Gaspar y Rimbau (1842-1902). ¿No les gustaría de saber qué aspecto tenía?