<!doctype linuxdoc system>
 
<!-- 	$Id: indexation.fr.m4,v 1.8 2001/10/14 02:02:03 gilles Exp $	 -->

<!--



	




-->
<article> 

<titlepag>
   <title>Indexation des documents de www.linux-france.org</title>
   <author>
    <name>
     <htmlurl 
	name="Gilles Lamiral" 
	url="mailto:lamiral@linux-france.org?subject=lfoyer 0.01">
    </name>
   </author> 
   
   <date>
    Mardi 20 août 2002 $Revision: 1.8 $
   </date>
   
   <abstract> 
    Indexation des documents de www.linux-france.org
   </abstract>
  </titlepag>
   
    	
<p>
Vous trouverez la dernière version du présent document à l'adresse:
<newline> <tt><url url="http://www.linux-france.org/prj/lfoyer/"></tt>
   
L'indexation des documents a fait l'objet d'une discussion sur la
<htmlurl 
	name="liste de diffusion mlfo" 
	url="http://groups.yahoo.com/group/mlfo/"> des contributeurs. Voici une proposition qui tente
de concilier l'ensemble des points de vues.
   
<sect>Existant
<p>
   
<itemize>

<item>
<url url="http://www.linux-france.org/carte.html">
<item> 
<url url="http://www.linux-france.org/carte_classee.html">

</itemize>
    
<sect>Contraintes
<p>

<itemize>

<item>
Les documents publiés sont majoritairement au format HTML.
     
<item>
D'autres formats existent: ASCII, pdf, Postcript, TeX, MSWord etc.

<item>Les types de source des documents sont multiples: ASCII, SGML
(HTML x, DocBook x, linuxdoc, (n|t)roff, (La)TeX, m4 etc.

<item>
Le site doit pouvoir être mis en miroir sans complication pour
ceux qui gèrent le miroir.

<item>
Le site doit pouvoir être déployé à partir d'une archive au
format tar.gz et permettre une navigation dans un système de
fichiers normal.

</itemize>
    
<sect>Projets
<p>

Des dicussions sur mlfo ont suggéré la création d'une base de données,
XML, DocBook, Zope, ghtml, wml, sdf, divers outils de création de
site. Je n'ai rien contre et je ne m'oppose pas à ces possibilités. Je
ne vois pas de consensus général. Si vous en voyez un, je suis impatient
de le connaître.
    
Une série d'index des documents triés par auteur, par date de dernière
modification, par thème, par type (html, ascii, pdf, postscript, msword,
framemaker, keuseje) serait salvateur dans bien des cas de recherche, de
mise à jour et de collaboration. Ce travail, en partie automatisable,
s'affranchie du format des documents sources s'il est basé sur le titre
(HTML), la date des documents, leur type.

<sect>Index, Header, Readme ?
<p>

Un défaut (parfois une qualité) de la présence d'un fichier
<tt>index.html</tt> est qu'il masque le comportement d'indexation à la
volée du serveur web.

Lorsqu'il n'existe pas de fichier <tt>index.html</tt> dans un
répertoire, les sous-répertoires et fichiers sont présentés sous forme
de liens, triés par nom, par date, par poids, voir même par leur
description.

C'est très pratique si l'arborescence est bien faîte.

Ce comportement peut-être maintenu en utilisant le nom
<tt>HEADER.html</tt> ou <tt>README.html</tt> à la place de
<tt>index.html</tt>.  Le fichier <tt>HEADER.html</tt> sera présenté
avant l'indexation à la volée. Le fichier <tt>README.html</tt> sera
présenté après l'indexation à la volée. Les deux peuvent être utilisés
en même temps.

Problème temporaire : tree.pl ne prend en compte que le nom
<tt>index.html</tt>, pas les autres.

<sect>Petit travail pour Grand résultat
<p>

Donnez un titre pertinent aux documents HTML principaux et nommez les
<tt>index.html</tt> directement ou par un simple lien symbolique. Le
titre apparaîtra alors sur le grand index général <url
url="http://www.linux-france.org/carte.html" name="carte.html"> sous
forme d'un lien qui mène au document. Il apparaîtra aussi sur le grand
index trié par date de dernière modification <url
url="http://www.linux-france.org/carte_classee.html"
name="carte_classee.html">.

</article>
