Idoia Salazar | 18 de junio de 2017
Rapidez, inmediatez. Si, en el pasado, el dicho periodístico de “las exclusivas de hoy envolverán el pescado de mañana” inundaba las redacciones, en la actualidad, en muchas ocasiones, ni siquiera llegan para recibir el pescado del mismo día de madrugada.
La ingente cantidad de información que se genera cada segundo en esta gran Aldea Global en la que nos encontramos –como ya predijo Marshall McLuhan– no deja sitio para el recuerdo. A veces, ni para la memoria a corto plazo.
Los datos disponibles en las páginas web están en continuo cambio y, según estudios realizados, muchas páginas no duran más de dos años activas. La vida media estimada de una web, sin que varíe la información en ella disponible, es de aproximadamente cien días. Si ya entramos en blogs o redes sociales, hablamos de minutos… o de segundos.
A veces, este hecho, esta sensación de que en internet abunda lo efímero, no es tal para aquellas personas que ven cómo sus datos o vivencias personales, en ocasiones indeseables, permanecen imborrables al paso del tiempo y accesibles para cualquier persona que busque algo al respecto. Es, ciertamente, un peligro entre las grandes ventajas que ofrece esta inmensa plataforma de publicación libre.
El “derecho al olvido” de cualquier persona es un derecho también en internet y así lo hizo saber el Tribunal de Justicia de la Unión Europea (TJUE) al hacer pública una sentencia el 13 de mayo de 2014. En ella se establecía que las personas tienen derecho a solicitar, bajo ciertas condiciones, que los enlaces a sus datos personales no figuren en los resultados de una búsqueda en internet realizada por su nombre. Es, por tanto, una desventaja cada día más salvable.
Cada poco tiempo se establecen nuevas leyes que regulan el “mundo virtual”, aunque delimitarlo sigue siendo una tarea difícil. Los datos, la información allí disponible siguen creciendo sin mesura. A veces, completamente accesible por cualquiera que sepa usar mínimamente buscadores como Google, y otras, bajo la llamada Deep Web, es decir, aquella parte de internet a la que no se llega tan fácilmente.
The Internet Archive, entidad no lucrativa ubicada físicamente en San Francisco (EE.UU.), nació en 1996 de la mano de Brewster Kahle, inventor de la tecnología WAIS (Wide Area Information Server).
The Internet Archive ha recopilado, desde el año 2001, recursos multimedia, libros, vídeos, audios y software.Organizaciones y empresas públicas y privadas, como Alexa Internet o la Biblioteca del Congreso de EE.UU., han contribuido a engrosar sus archivos y convertirlos en un referente en el campo de la investigación.
Sus creadores la idearon inspirándose en la Biblioteca de Alejandría, que presumía de poseer una copia de cada libro que se publicaba en el mundo.
The Internet Archive agrupa sus secciones –en continuo crecimiento– por temas: Textos, Vídeos, Audio, Sofware e Imágenes.
En la sección de Textos ofrece, en la actualidad, más de 10 millones de libros y textos completos gratis, de todos los lugares del mundo, más de 140.000 en español. Incluye, además, una serie de 300.000 eBooks modernos que pueden ser descargados aquí.
La sección de Vídeo incluye más de 3 millones de películas digitalizadas con una amplia temática, desde cine clásico y moderno hasta noticias y videojuegos.
La sección de Audio contiene más de 3.200.000 archivos y su temática va desde shows de radio antiguos a todo tipo de conciertos y programas de noticias.
Respecto a la sección de Software , The Internet Archive presume de tener la mayor colección histórica del mundo. Permite acceder instantáneamente a millones de programas, imágenes de CD-ROM, documentación y recursos multimedia.
Por último, en el archivo de Imágenes encontramos imágenes digitalizadas de amplio rango, desde mapas físicos a fotografías de astronomía o del mundo del arte. Muchas de ellas con licencia Creative Commons, listas para su descarga gratuita.
The Internet Archive posee, además, una herramienta muy útil para cualquier investigador. Se trata de un buscador denominado The WayBackMachine. Ya en su lema: “Busca la historia de más de 279 billones de páginas web en Internet”, nos da una idea de sus dimensiones y utilidad.
Un sistema que permite encontrar, ya sea por palabras clave o dirección web exacta, páginas que ya han sido borradas de su ubicación o renovadas. Tan solo hay que imaginar su utilidad a la hora de encontrar determinadas citas de documentos que, en multitud de ocasiones, llevan al típico mensaje de “Error 404:File not found”. En este caso, habría que buscar la fecha de publicación del libro o del documento y “trasladarnos” allí con la Wayback Machine.
El resultado le reportará una lista de fechas correspondientes a cuando esa página web fue archivada y, al pulsar sobre cada una de ellas, se desplegará cada web con la información tal y como estaba en esta fecha. Si a la fecha le acompaña un asterisco, significa que se ha detectado un cambio en esa página respecto a la que fue indexada la primera vez.
Otra de las ventajas a tener en cuenta es que los enlaces de estas webs están activos y apuntan a otras páginas del mismo sitio web, tal y como estaban en este mismo periodo. Gracias a esto, si un investigador no conoce la URL exacta de una determinada página, podría localizarla navegando por el sitio web del periodo en cuestión.
Como veis, The Internet Archive es un recurso muy valioso para cualquier investigador. Algo a tener en cuenta más allá de las búsquedas convencionales, más allá de Google. De vez en cuando, merece la pena bucear un poco más en la red de redes para extraer todo su beneficio.