jun 11 2010

Receta: cómo obtener listado de links rotos

Published by admin at 12:06 pm under Utilidades

Hoy me han pedido que saque un listado de los enlaces rotos dentro de cierta web. ¡Ah! Nada más fácil en Linux:

$  wget --spider  --no-parent -r -o log.txt http://tuweb.com

Sweet wget…

–spider : recorrer la web que le digas, pero SIN descargar nada. Sólo recorrerla.
- r : recursivo, como si fuera el robotito de Google :-)
- o fichero : la salida de ejecutar el comando que salga por pantalla
–no-parent : si le pasamos como parámetro un nombre de directorio, no queremos que suba hacia los directorios padre.

La lista de enlaces rotos estará en log.txt (parte final)

10 responses so far

10 Responses to “Receta: cómo obtener listado de links rotos”

  1. Eduardoon 11 jun 2010 at 6:35 pm

    Genial, Gracias.

  2. Josu O.on 12 jun 2010 at 8:46 am

    Interesgarria eta erabilgarria!!!
    Delicious-era segituan!!!
    Eskerrik asko!!

  3. adminon 12 jun 2010 at 1:37 pm

    @Josu: eskerrik asko zuri! MoodleMoot-en ikusiko dugu elkar ostiralean :-)

    @Eduardo: de nada!

  4. ozvaon 15 jun 2010 at 6:44 am

    Te sigo desde RSS desde algunos meses.. te agradezco el post. No tenia idea de estas virtudes de wget. Saludos

  5. Koro Gabiolaon 15 jun 2010 at 10:40 am

    Eskerrik asko, ahora mismo lo acabo de poner a trabajar ;)

  6. Aitor Cuartangoon 17 jun 2010 at 4:41 pm

    Plas plas plas!!

  7. [...] Fuente |Diario Linux [...]

  8. [...] cosas por las que uno ama Linux. Encontré este post en DiarioLinux que me pareció [...]

  9. [...] leí en Diario Linux un interesante post que explica cómo obtener un listado de los links rotos de una web. Lo ejecuté en NetStorming y, luego de un par de horas de ejecución, encontró 11 links rotos que [...]

  10. Twitter azken astea 2010-08-15on 15 ago 2010 at 1:04 am

    [...] cómo obtener listado de links rotos http://diariolinux.com/2010/06/11/receta-como-obtener-listado-de-links-rotos/ [...]

Trackback URI | Comments RSS

Leave a Reply

« Back to text comment