Archive.org: memoria histórica de la Red

Artículo original publicado el 5 de abril de 2014 por Marcos Merino en TICbeat

$\"WaybackMachine\"$ En 1996, Brewstar Kahle era un ingeniero informático que había participado en el desarrollo de WAIS (el abuelo de la World Wide Web) y que ya había fundado y vendido a AOL una compañía tecnológica, y que en ese momento se disponía a iniciar otros dos proyectos (ambos inspirados en el nombre o en su función, en la Biblioteca de Alejandría): una empresa (Alexa Internet) y una organización sin ánimo de lucro: Internet Archive.

Alexa es hoy día una subsidiaria de Amazon, y el principal ranking de visitas para webs de todo el mundo, pero cabe aventurar que en el futuro Internet Archive será considerado la gran aportación de Kahle: una biblioteca que, en resumen, intenta conservar una copia de todo el contenido de Internet, el archivo con mayor tasa de crecimiento de la historia de la Humanidad. Constantemente aparece y desaparece contenido en la Red, e Internet Archive procura -dentro de sus limitaciones- que el material desaparecido sea el menor posible, para poder dejar así un registro a las futuras generaciones. Es, además, una organización activista, que promueve activamente el acceso libre a Internet y a sus contenidos.

Esto recogía un artículo de 2002:

“Ubicado en uno de los barrios más sórdidos de San Francisco es una sala llena de más de doscientos equipos (…) aquí se almacenan más de 10 mil millones de páginas. El contenido de un solo equipo es equivalente a toda la Biblioteca del Congreso. Más de 250 gigabytes de datos se añaden a diario. ¡Más de 12 terabytes se añaden cada mes y hay un total de más de 120 terabytes de almacenamiento disponibles”.

Algunas cosas han cambiado desde entonces: en 2012 sus servidores ya alojaban 10 petabytes… y subiendo. Y desde 2009, la sede se encuentra en una elegante antigua iglesia de la Avenida Funston de San Francisco.

Pero fue 2001, tras una visita a las oficinas de Altavista, cuando Kahle implementó la que quizás sea la funcionalidad más útil y exitosa del Internet Archive: la Wayback Machine, el buscador de direcciones URL que arroja como resultados las diferentes copias de seguridad de aquéllas a lo largo del tiempo, permitiéndonos así acceder a contenido desaparecido, o tener “instantáneas” que recogen la evolución de una web en los últimos 13 años. Una máquina del tiempo digital, vaya.

Además de eso, Archive.org alberga colecciones de Vídeo (1.579.093 películas a día de hoy: una gran parte de ellas son producciones independientes copyleft, clásicos que ya han pasado a dominio público, cortos de servicio público de propiedad gubernamental, etc.), Música en Directo(126.568 conciertos), Audio (1.934.033 grabaciones, incluyendo podcasts remitidos por los usuarios), Textos (6.041.686 piezas en este caso, procedentes de multitud de bibliotecas de Norteamérica y el resto del mundo, así como del Proyecto Gutenberg), y Software (con 52.136 programas, sobre todo videojuegos de MS-DOS, ROM para emuladores, y copias de antiguos FTP de renombre, como el de Netscape). El proyecto ha contado también con ayuda (en forma bien de fondos, bien de contenido digitalizado) de compañías y entidades como Google, la Biblioteca del Congreso de los Estados Unidos, o la NASA.

Fuente: TICbeat

Deja un comentario Cancelar respuesta