<!doctype linuxdoc system>
 
<!-- 	$Id: chasse_404.fr.m4,v 1.10 2004/03/15 19:09:35 gilles Exp $	 -->

<!-- Bienvenue dans le monde SGML et m4 -->
<!--


	

-->

<article> 

<titlepag>
<title>La chasse aux liens cassés</title>
<author>
<name>
<htmlurl 
	name="Gilles LAMIRAL" 
	url="mailto:glamiral@linux-france.org?subject=lfoyer 0.01">
</name>
</author> 
   
<date>
$Revision: 1.10 $   $Date: 2004/03/15 19:09:35 $ 
</date>

<abstract> 
La chasse aux liens cassés
</abstract>
</titlepag>

<p>
Version HTML générée le Lundi 15 mars 2004
<!-- 
-->

Vous trouverez la dernière version du présent document à l'adresse:
<newline> <tt><url url="http://www.linux-france.org/prj/lfoyer"></tt>

<htmlurl url="../.." name="Index des documents">

<sect>404 et 301
<p>

La plupart des erreurs sont des 600 (hors HTTP), 404 ou des
301. Les 600 c'est que le nom du serveur n'existe même plus
(contact impossible). Les 404, ç'est pénible pour les
lecteurs. Plus de 10% des requêtes sur lfo sont des 404, par
exemple 345921/3282816 en février 2004 : <url
url="http://www.linux-france.org/stats/usage_200402.html">.

<verb>
404: Not Found         (c'est grave, l'utilisateur est frustré)
301: Moved Permanently (moins grave, mais allonge les requêtes)
</verb>

Il y a de nombreux 301 dus simplement à des url sans "/" final sur des
répertoires. 

<sect>Outils
<p>

Pour chaque responsable de rubrique, il y a un lancement en
crontab de bin/chasse404_from_authsync le 1er de chaque
chaque mois à minuit. Cela génère un fichier nommé
chasse404z.txt pour chaque zone de de responsable ayant
l'option --delete. Vous pouvez accéder à ces fichiers par
l'intermédiaire de l'url <url
url="http://www.linux-france.org/maint/authsync.log.html">.


<sect> Un gros morceau, carte.html
<p>

Le fichier carte.html passe en revue l'ensemble des index.html du
site. Un relevé des liens cassés à partir de ce fichier est un bon
début pour détecter les liens cassés et surtout les corriger.

Le relevé recursif de profondeur 1, sur <url
url="http://www.linux-france.org/carte.html"
name="carte.html"> : <url url="http://www.linux-france.org/chasse404z.txt">


Ce relevé est fait en crontab (lf/memo/cl_carte) le 1er de
chaque chaque mois à minuit.


<sect>Autres outils
<p>

Etienne Herlent a créé un vérificateur:<newline>
<url url="http://webperso.easyconnect.fr/eherlent/linuxmac_verifurl.html">


Le programme utilisé sur lfo est cl-1.0.1.pl : <url
url="http://www.jmarshall.com/tools/cl/">


</article>
 
<!-- Local IspellDict: francais -->
 
 

