Monitorear Cambios en Sitios Web sin RSS Feeds

junio 1, 2008

Aunque es para no creerlo, todavía hay sitios que no tienen RSS feed, por lo que la única alternativa para saber cuando hay cambios en el sitio, es visitarlos de vez en cuando, o usar servicios públicos, cómo FEED43, o RSSPECT. Buscando para solucionar una necesidad personal, me encontré con WebSec (ó Secretaria Web), que automatiza el proceso de visitar regularmente un sitio web, y es tan simple que llega a dar verguenza no haberlo imaginado: corre un CROB, comparando el contenido de un sitio web con el que tiene guardado. Si el contenido cambió, te va a mandar un e-mail con el contenido cambiado, resaltado.

Puede parecer simple, pero me ha sido de gran ayuda, aunque tiene un par de limitaciones: (1) No se puede monitorear un sitio completo por si mismo, sino que solamente una página, (2) Se puede excluir algún texto en la comparación, pero si hay multiples líneas no se puede excluir.

No pude encontrar otro paquete que hiciera lo mismo que Websec, todos los demás generan RSS, y no mandan e-mails con los cambios. Ahora sería interesante mejorar lo que hay en función de su propio código: http://baruch.ev-en.org/proj/websec/.

Según cache, está disponible para Debian y Ubuntu, y parece correr sin ser atacado por una plaga de bugs.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: