Salut,
Omnisilver a écrit :Relecture rapide de la page des dictionnaires :
- que diriez-vous de supprimer le dictionnaire 3 (Le dictionnaire MySpell français), qui est inutile vu qu'il a été repris et amélioré par Vazkor ?
(d'ailleurs j'ai du mal à saisir comment le dictionnaire a perdu 37 ko alors que des nouveaux mots ont été rajoutés ).
La perte de poids s'explique assez facilement.
Le fichier fr-FR.aff a été nettoyé de toutes les règles non-utilisées et ramené de 22 Ko à 18 Ko.
L'ancien dictionnaire classique fr-FR.dic contenait 92482 lignes dont :
- un paquet de mots-composés d'un ou plusieurs traits d'union, dont ni Hunspell ni MySpell ne tiennent compte. Je les ai scindés en leurs composants et j'ai supprimé les doubles.
- des noms propres commençant par une voyelle pour lesquels on n'avait pas utilisé les drapeaux L et M pour gérer l'+mot et d'+mot. J'ai corrigé cela, ce qui m'a permis de supprimer un tas de lignes comme l'Afrique et d'Afrique.
- les drapeaux p et q générant les formes s'+ "verbes essentiellement pronominaux" aux 3 pers sing et plur. étaient mal utilisés, d'où des formes devaient être reprises intégralement. En améliorant cela j'ai ramené cette liste de lemmes de 8000 à environ 2000.
- j'ai supprimé des mots vraiment trop rares mais proches de mots courants.
Même en ayant ajouté un paquet de nouveaux mots, le nombre de lignes est descendu à 82400 environ, soit un gain de ± 10.000 lignes.
Taille du fichier du dernier fichier fr-FR.dic mis sur mon site le 07/08/07 : 1 028 657 octets pour 82452 lignes tout compris.
Taille du fichier le 31/07/2006 : 1 173 085 octets pour 92482 lignes.
Pour le reste, les fichiers txt sont identiques ou plus légers, surtout celui où la licence GPL était reprise en entier.
Enfin j'utilise Winrar pour compresser les zip au maximum (9 au lieu de 5 qui est la méthode normale).
Cela explique facilement une différence de 37 Ko.
@+
Message envoyé avec : Mozilla/5.0 (Windows; U; Windows NT 5.0; fr; rv:1.8.1.6) Gecko/20070725 Firefox/2.0.0.6
Il n'y a que deux choses infinies: l'univers et la bêtise humaine et encore, pour l'univers, je ne suis pas sûr (Einstein)