Arqueología web

Breve historia de cómo rescaté los contenidos de mis blogs antiguos que creía perdidos para siempre

Cuando hace unos días tuve que recuperar el blog de Gustavo Montes, repasándolo para verificar que no se había perdido nada, me encontré con muchísimas referencias antiguas a mis propios blogs. Sobre todo a m4rt1n.com, un blog que mantuve desde 2006 hasta 2008. Hacía muchos años que yo había retirado el contenido de este blog de internet, pero, lo que es peor, hace un tiempo ya que perdí incluso la titularidad del dominio. Estaba perdido para siempre.

Pero también me entró nostalgia de martinalia.com, un dominio que sigue siendo de mi titularidad pero que, desde 2004, había pasado por varias fases. Desde 2004 hasta 2006 era un blog más o menos personal con bastante enfoque en el ámbito de la Gestión de Contenidos. Era un blog muy peculiar, que utilizaba un CMS francés que me encantaba, SPIP. Anteriormente a esta fase, desde 2001, había publicado varios contenidos, pero estos se perdieron para siempre.
martinalia.com antiguo

En 2006 adquirí m4rt1n.com, el dominio que antes comenté que ya he perdido (se me pasó la fecha de renovación en Godaddy…). Estuvo funcionando como mi blog personal durante tres años, y tenía este aspecto (la imagen es de muy mala calidad, pero es lo único que conservo):

com

Años después, en 2009, actualicé el blog martinalia.com a SPIP 2.0, una versión muy mejorada, utilicé una plantilla minimalista y me centré en la Gestión de Contenidos. Todos los artículos anteriores quedaron arrinconados en una escueta sección llamada “antiguos”:

martinalia.com

Posteriormente también abandoné este blog, hasta que en 2011 le di un cambio absoluto y construí uno nuevo (con el lema “Objetivo Brasil”) que era todo un ejercicio de “personal branding”. Por motivos personales tenia la necesidad de moverme hacia Brasil, y el blog fue una pieza más en ese esfuerzo (que finalmente conseguí al cabo de unos meses).

objetivo brasil

Lo cierto es que esto también dejó de tener sentido una vez alcanzado el objetivo, y finalmente lo abandoné también No fue hasta el año pasado que martinalia.com volvió a funcionar, esta vez un WordPress en el que voy subiendo críticas de películas que me interesan sin ningún orden cronológico ni de ningún otro tipo. Tan solo lo que se me antoja. También ofrezco “extras” bien interesantes para los usuarios registrados.

En cualquier caso, haciendo memoria me entró bastante nostalgia y decidí que todos esos contenidos desaparecidos merecían ser rescatados, que al fin y al cabo formaban parte de mi historia personal. Pero -y era un gran problema- tan sólo conservaba copia de seguridad del último, todos los anteriores habían desaparecido para siempre.

Archive.org al rescate

Sin copia de seguridad, la única alternativa que me quedaba era recurrir al servicio WayBack Machine que ofrece gratuitamente Internet Archive, una entidad sin ánimo de lucro que conserva en sus archivos millones de sitios webs, películas, libros, etc. En WayBack Machine quedaba constancia de todas estas antiguas versiones de mis blogs… el problema era, claro, cómo extraer esa información y poder migrarla a martin.ekiry.com.

La solución me vino con Wayback Machine Downloader, una herramienta sencilla y potente que me permitió hacer justo lo que necesitaba. Para utilizarla debes tener instalado previamente Ruby. Para instalar Wayback Machine Downloader sólo hay que teclear lo siguiente en una terminal:

gem install wayback_machine_downloader

Una vez instalado, su uso es de lo más sencillo. Con los siguientes comandos en el terminal descargué todos mis blogs “perdidos”:
wayback_machine_downloader http://www.m4rt1n.com --timestamp 20090425231334
wayback_machine_downloader http://www.martinalia.com --timestamp 20090625231334
wayback_machine_downloader http://www.martinalia.com --timestamp 20060325231334

Listo. Ya tenía todo el contenido guardado en mi disco duro. Ahora lo que tenía que hacer es pasar todos los artículos, que había guardado en formato HTML, a la base de datos de martin.ekiry.com. Para ello utilicé el plugin HTML Import2. Misión cumplida.

Eso sí, algunos (pocos) artículos se perdieron para siempre, porque Internet Archive no los había almacenado. Casi todas las imágenes se habían perdido también, con lo cual me tocó una tediosa tarea manual de búsqueda y reposición de imágenes (algunas de las originales se perdieron para siempre).

Pero básicamente está todo recuperado, disponible ahora aquí en martin.ekiry.com casi toda mis publicaciones en internet (salvo las anteriores a 2004, que esas también se perdieron para siempre).

Deja un comentario