Utilizzare wget per trovare i dead link (404 Not Found) di un sito

maggio 27, 2010 by  
Filed under Unix/Linux

wgetSe avete un sito web di una certa dimensione, è quasi inevitabile che vi siano qua e la dei “dead link” ovvero link che puntano a pagine inesistenti per i quali il web server ritorna l’errore HTTP 404. Poiché è cosa nota che la presenza di questi link all’interno di un sito può essere penalizzante in ottica SEO, è buona norma effettuare ad intervalli regolari un controllo a tappeto di tutte le pagine al fine di assicurarsi che tutti i link siano corretti. Read more

Cambiare la struttura dei permalinks di WordPress senza perdere il PageRank

febbraio 28, 2007 by  
Filed under Varie, WP Plugins

Oggi forse qualcuno avrà notato dei comportamenti bizzarri navigando sul blog, tipo errori http 404 o 500. Erano tutti dovuti alla mia foga di effettuare alcune modifiche alla struttura dei plink del blog.

Mi ero infatti dato essenzialmente due obiettivi:

  • Modificare la struttura dei permalink dal formato “/%year%/%monthnum%/%day%/%postname%/” a quello più search engine friendly, “/%category%/%postname%/”.
  • Togliere il fastidiosissimo “/blog” dall’URI del blog.

Chiaramente il tutto doveva avvenire senza che ne risentisse l’indicizzazione già effettuata dai motori di ricerca, vale a dire utilizzando dei Permanent Redirect.

Ad ora quello che sono riuscito a fare è stato solo traguardare il primo obiettivo: se notate la struttura dei link ai post e’ cambiata e sono riuscito a mantenere il pagerank della vecchia URL grazie al plugin “Dean’s Permalink Migration” che si è dimostrato perfettamente adqguato allo scopo. Per quanto riguarda invece il secondo punto la cosa si è rivelata un tantino più ostica tanto che ho deciso di sospendere le “sperimentazioni”, dato che le effettuavo a caldo direttamente sul blog. In ogni caso ritengo che l’unica strada percorribile sia quella dell’implementazione di un plugin ad hoc che filtri sull’ API “generate_rewrite_rules” di WordPress le URI con pattern simile a “^blog/(.*)$”.