Interesante método, que descubrí en DiarioLinux, para detectar los links rotos dentro de un sitio web (completo) usando la poderosa herramienta wget.
Esto es súper fácil de hacer en Linux. Abrí un terminal y escribí:
wget --spider --no-parent -r -o log.txt http://www.syswoody.com
Aquí el funcionamiento de cada uno de los parámetros:
–spider : recorrer la web que le digas, pero SIN descargar nada. Sólo recorrerla.
– r : recursivo, como si fuera el robotito de Google 🙂
– o fichero : la salida de ejecutar el comando que salga por pantalla
–no-parent : si le pasamos como parámetro un nombre de directorio, no queremos que suba hacia los directorios padre.
Es posible que tarde un buen rato en terminar (ya que analiza todo el sitio web completo o el directorio que le hayas indicado). La lista de enlaces rotos estará en log.txt (parte final)
En caso de que quieras aprender más sobre wget, escribí