[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [gulliver] publication de dictionnaire
|
From |
Yohann Lepage <yohannlepage at gmail dot com> |
|
Subject |
Re: [gulliver] publication de dictionnaire |
|
Date |
Tue, 2 Jun 2009 10:09:04 +0200 |
Salut,
Pour l'édition du dictionnaire (hors ligne), tu peux jeter un coup
d'oeil à ça Linguae qui est un gestionnaire de dictionnaires,
multiformat et multiplateforme. C'est en version alpha mais tu as de
quoi t'amuser si tu connais un peu python.
http://linuxfr.org/2009/06/01/25543.html
Yohann L.
Le 25 mai 2009 12:25, ths <ths at o-tra dot net> a écrit :
> Hello !
>
> Merci à tous pour vos conseils. La solution qui me semble la plus
> intéressante est de publier ces textes en ligne effectivement déjà en *.rtf
> et de développer une petite appli php/mySql pour rentrer tout ça dans une
> base de données. (Et accessible aux gens qui voudraient contribuer à faire
> rtf --> DB)
>
> Merci encore,
>
> Tranquillement,
> thomas
>
>
>
> Yannick a écrit :
>>
>> ths at o-tra dot net a écrit :
>>>
>>> Merci de tes conseils. Je développe assez bien en php / mySql / python et
>>> quelques autres langages... je vois donc assez bien ce que tu veux dire. Je
>>> cherchais plutôt à trouver un cms ou plugin de lexique par exemple, ou
>>> encore mieux directement dictionnaire . Comment faire son dictionnaire en
>>> ligne, avec des outils de recherches avancées performants, d'exportation de
>>> définitions, de lien direct vers une définition etc etc ?
>>> (et soudain là je pense à wiktionnaire MediaWiki ... )
>>>
>>
>> Bonsoir,
>>
>> Quelque soit la solution choisie tu as toujours le problème de la saisie.
>>
>> Comme tu as réussi le passage à l'OCR je pense que la solution php/MySql
>> est une bonne solution mais je suggère les tables liées (je ne sais pas
>> faire).
>> Une table d'appel et une table de définition en coupant au maximum cette
>> partie.
>> Table 1
>> id
>> Mot
>> Page_original
>> Nom_du_scan
>> Mots_lies
>> Definition qui correspond à Id de la table 2
>>
>> Table 2
>> Id qui correspond à Definition de la table 1
>> Type (Nom (M,F), verbe, adverbe ...
>> Origine du grec, du latin, du yyyyyy
>> xxxxxxx tout truc utile pour un tri éventuel
>> Definition
>> Note
>>
>> Je conseille de toujours éclater l'information en un maximum de champs car
>> il est toujours plus facile de regrouper des infos sur plusieurs champs que
>> de les éclater en plusieurs à partir d'un seul. Tout n'est pas
>> automatisable.
>>
>> Donc tu interroges sur table 1 dans Mot et Mots_lies
>> et tu affiches sur Table 1 et Table 2
>>
>> Tu as deux solutions
>> 1) tu mets les scans en ligne et dans ce cas tu zappes table 2 et tu fais
>> lors de l'affichage un lien avec le Nom_du_scan vers ton fichier.
>> 2) tu ne mets pas en ligne les images et tu précises que tu as recopié
>> in-extenso l'article correspondant au mot en conséquence la communication du
>> scan de la page ne présente pas d'intérêt.
>>
>> Perso j'utilise systématiquement la solution 2 car sinon il faudrait que
>> je me fasse un serveur à la maison avec un groupe électrogène en cas de
>> coupure de courant. Je donne la possibilité d'obtenir une copie de la photo
>> du document moyennant participation modique mais significative aux frais de
>> réalisation du relevé mis à disposition.
>> Je dois avoir quelque choses comme 90 000 lignes d'informations et je
>> continues d'en mettre régulièrement pour un nombre de documents (photos et
>> originaux) qui doit avoisiner les 70 000.
>>
>> Cela te donne une idée du travail qui t'attend. :)
>> J'ai aussi des ouvrages mis en lignes avec l'autorisation des auteurs et
>> j'en ai encore à mettre mais voilà il n'y a que 24h/jour. ;)
>>
>> Amitiés
>>
>
> ---- Liste gulliver ----
> Archives, http://gulliver.eu.org/ml-archives/
> Description, http://gulliver.eu.org/ml/ml.html
> Bons usages, http://gulliver.eu.org/wiki/UsagesCourriels
>
>
--
Yohann L.
GPG fingerprint : C8DB 2466 E48D 4323 669D C8AC 9833 136F BA04 8DC4
http://www.2xyo.info