Salut,
Tiny905 a écrit :
Par contre j'ai l'impression que certains mots courants ne sont pas dans le dico, par exemple il ne connait pas "télécharger" !!! Et j'ai pas trouvé comment rajouter des mots

J'ai passé quelques mois à comprendre et décortiquer les fichiers .dic et .aff utilisés par OOo, FF, TB, Nvu.
En fait ils se basent tous sur une version du dico créé vers 2000 par Christophe Pythoud pour Ispell et Francais-GUTenberg.
Le fichier fr-FR.dic n'est qu'un fichier texte que vous pouvez très bien éditer avec UltraEdit shareware ou
PSPad freeware en gardant si possible le format Unix.
La première ligne sert pour un hash, c'est un nombre qui doit correspondre au nombre de lignes - 1
Viennent ensuite les lemmes (mots de base) suivi d'un / et des drapeaux correspondant aux affixes (préfixes et suffixes) autorisés pour créer les variantes/formes dérivées.
Vous pouvez ajouter "télécharger" tout simplement, mais seul l'infinitif sera reconnu comme correct. Autant l'ajouter au dictionnaire personnel (persdict.dat)...
Le plus simple est de retrouver le lemme de base, dans ce cas "charger", et toutes ses formes conjuguées pour les faire précéder de télé.
Vous recherchez "charger" et vous copiez la série de lemmes:
charge/u
chargeai/w
chargeais/v
chargement/S
charger/y
chargerai/x
chargeur/S
Vous préfixez avec "télé" ce qui vous donne:
télécharge/u
téléchargeai/w
téléchargeais/v
téléchargement/S
télécharger/y
téléchargerai/x
téléchargeur/S
Vous collez cette nouvelle série dans le fichier dic.
Vous pouvez la mettre dans l'ordre alphabétique, entre télécabine et télécinéma, mais ce n'est pas indispensable.
Vous augmentez le nombre en première ligne de 7 unités et le tour est joué.
Cela ne fonctionne pas aussi simplement avec les verbes commençant par une voyelle ou un h aspiré. Il faudrait alors supprimer les drapeaux jlnmst présents correspondant aux élisions, devenus sans objet.
A part cela, les correcteurs fonctionnent très bien chez moi, mais j'ai constaté que les fichiers .dic contiennent pas mal d'erreurs (drapeaux répétés du genre /jnlvjnmlv, ce qui n'est pas grave mais peu élégant. Drapeaux erronés genre /XG après des lemmes auquels ils ne peuvent pas s'appliquer).
Il faudrait qu'un linguiste se penche sérieusement sur ces fichiers dic, pour en vérifier le contenu.
Je l'ai déjà fait en partie pour mon compte personnel, mais je suis loin d'avoir terminé. Pensez qu'il y a près de 70000 lemmes avec drapeaux à examiner, de quoi devenir dingue.
@+
Rpkx, correcteur fou sur Wikipédia et eBooks Libres et gratuits.
Message envoyé avec : Mozilla/5.0 (Windows; U; Windows NT 5.0; fr; rv:1.8.1) Gecko/20061010 Firefox/2.0