Félicitation pour ton travail.

Parlons "politique" maintenant puisque tu y tiens. Il te reste à me convaincre au sujet de tes histoires d'espace fine
insécable avant une quelconque généralisation de la procédure maintenant que cela me semble faisable grâce à
ton script :
1) je m'étonne car dans tous les documents que j'ai trouvé, il est dit que devant le symbole (:), il faut mettre un espace insécable normal ???
2) je n'ai trouvé aucun document officiel qui nous fixe les règles en usage en français ???

Pourrais-tu me fournir des références officielles concernant les règles en usage en France ?

Ensuite, pour répondre à ta question, je crois que nous avons déjà décidé que nous étions prêt à faire un essai sur un gros module de traduction pour voir si cela posait des problèmes informatique, nous n'avons juste pas encore choisi le module pour GNOME 3.0. Patience, on a encore quelques mois.

Cordialement

Bruno


Le 26 novembre 2010 20:16, Nicolas Delvaux <nicolas.delvaux@gmx.com> a écrit :
Salut à tous,

voici encore une nouvelle version de mon script de correction/vérification des .po.

Liste des nouveautés :

- Le script est presque deux fois plus rapide ;
- Le script détecte (et signal) maintenant si une chaine et sa traduction ne se terminent pas par le même signe de ponctuation ;
- L'option « --ortho » à été améliorée

Voilà pour cette fois. Pour le téléchargement, c'est toujours ici : http://malaria.perso.sfr.fr/francisator.tar.gz

Je pense que le script commence à être mature, n'hésitez pas à vérifier vos .po avec son aide.

Reste maintenant LA grande question : qu'en est-il des espaces fines insécables ?
Vu que le script fait tout le boulot (et plus encore), je pense que la décision n'est plus que politique maintenant.


Bonne soirée,
Nicolas


Le dimanche 21 novembre 2010 à 21:40 +0100, Nicolas Delvaux a écrit :
Salut à tous,

Suite à une discussion avec Bruno, j'ai le plaisir de vous présenter une version nettement améliorée de mon script de vérification/correction.

Voici les changements par rapport à hier :

- Beaucoup moins de « faux positifs » dans la liste des erreurs « potentielles » (ça reste très variable selon les .po) ;
- Chaque erreur vient avec son contexte (plus besoin de naviguer entre le .po et la liste des erreurs pour vérifier si une erreur est fondée ou pas) ;
- Le script détecte (et signal) maintenant la présence de plusieurs espaces à la suite ;
- La détection de la validité des balises XML a été complétée et grandement améliorée ;
- L'indicateur d'avancement est maintenant plus compréhensible ;
- Le diff entre le .po original et le .po corrigé n'est plus généré automatiquement (c'était assez inutile et c'est facilement faisable manuellement si besoin).

De plus, vous pouvez maintenant rajouter « --ortho » en argument sur la ligne de commande pour qu'un fichier ne contenant que les chaines traduites soit créé.
Ça permet de gagner du temps si vous souhaitez chasser les fautes d'orthographe avec un éditeur de texte. (au début il faudra tout de même lui dire d'ignorer certains mots, mais il ne faut le faire qu'une seule fois à priori).


Voilà, ça me parait déjà pas mal.
Je précise aussi que ce script est sous licence BSD, chacun peut l'adapter et le redistribuer comme bon lui semble.
Cependant, vu que ce script pourrai également servir à d'autres équipes de traducteurs, il serait tout de même souhaitable de centraliser les améliorations/corrections.
(si besoin, il devrait-être possible de l'héberger sur traduc)

Le script peut toujours être téléchargé à la même adresse : http://malaria.perso.sfr.fr/francisator.tar.gz


Bonne soirée !
Nicolas


Le samedi 20 novembre 2010 à 17:58 +0100, Nicolas Delvaux a écrit :
Salut à tous,

Chose promise, chose due voici le fameux script dont nous parlions la semaine dernière : http://malaria.perso.sfr.fr/francisator.tar.gz
Je vais essayer de vous dire tout ce qu'il faut savoir de manière concise (c'est pas gagné :-p).

Dans l'archive sur lequel pointe le lien ci-dessus, vous trouverez deux choses :
- le script en lui même (francisator.sh)
- un fichier de test (test.po)

Vu qu'il peut-être très pénible de vérifier tout ce que fait le script sur des fichier .po de plusieurs milliers de lignes, il est beaucoup plus commode d'utiliser un fichier de test pour mettre le script à l'épreuve.
Libre à vous de modifier/compléter ce fichier test en y mettant les situations les plus improbables que le script pourrait jamais rencontrer (enfin il faut tout de même que ça reste un fichier .po valide ;-)).

Que fait le script ?

1/ Il corrige directement les espaces devant les signes de ponctuation qui vont bien (il remplace les espace et les espaces insécables par des espaces fines insécables)
→ vu qu'il s'agit d'une correction automatique, c'est bien sûr cette partie qui doit être particulièrement testée. D'après mes tests elle est 100% fiable. Tous les pièges cités par Bruno la semaine dernière sont déjoués (et ce ne sont pas les seuls).
L'intérêt est de pouvoir faire confiance à cette partie du script : s'il faut examiner attentivement des diff de corrections de plusieurs centaines de lignes à chaque fois, ça n'a aucun intérêt.
Utilisez le fichier test pour vous convaincre de sa fiabilité et/ou trouver des bugs qui m'auraient échappé !


2/ Le script vérifie également la présence de certaines erreurs *potentielles*. Notez bien que vu que ces erreurs sont potentielles, elles ne sont que *signalées* (et non corrigées directement).
Pour chaque problème, le script vous indique la ligne correspondante (ce qui est très pratique).
Voici la liste des choses qui sont vérifiées :
- Présence d'autant de balise ouvrantes que fermantes (détecte par exemple "<gui><em>Test !<em></gui>")
- Un signe de ponctuation non précédé par une espace fine insécable (car la substitution automatique ne touche pas à certains cas tendancieux)
- Présence d'une espace insécable (il est sensé en rester très peu voir aucune après la correction automatique, c'est donc louche)
- Emploi d'un « B » dans une unité au lieu d'un « o » pour un octet (d'après mon expérience, c'est une erreur assez fréquente chez les débutants)

3/ Le script applique les 2 points précédents uniquement sur les chaines traduites (blocs « msgstr »). Les commentaires et les chaines originales ne sont pas modifiés.

Voilà.
J'ai testé le tout avec succès avec plusieurs .po officiels.
Par exemple avec Rhythmbox (plus de 1200 chaines), je confirme n'avoir trouvé aucune erreur dans la correction automatique. De plus le script détecte 17 erreurs potentielles, mais il semble que seule une soit vraiment fondée (une espace insécable curieusement placée ligne 2426).


J'attends vos remarques et commentaires.
Je suis également à l'écoute si vous avez des idées pour améliorer le script (d'autres types d'erreurs à vérifier par exemple).

Bon week-end,
Nicolas


ps : (rappel) en attendant que ce bug soit officiellement résolu ( https://bugzilla.gnome.org/show_bug.cgi?id=626126 ), la manière la plus simple de reconnaitre une espace fine insécable d'une espace insécable dans gedit (par exemple) est de lancer une recherche sur le caractère souhaité. Celui-ci sera alors surligné dans tout le fichier.


_______________________________________________
Gnomefr mailing list
Gnomefr@traduc.org
http://listes.traduc.org/mailman/listinfo/gnomefr