Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

Sa casquette est rouge foncé ou foncée

20 réponses
Avatar
Diane
Foncé s'accorde ou non

10 réponses

1 2
Avatar
Clément Marcotte
Demande aux vieux croulants dans l'igloo.

www.academie-francaise.fr

"Diane" a écrit dans le message de news:

Foncé s'accorde ou non


Avatar
Modeste
Bonsour® Anacoluthe avec ferveur ;o))) vous nous disiez :

Rouge est invariable si associé à un adjectif ou un substantif de nuance
- Des casquettes rouge tomate
une nuance qui fait la différence, en quelque sorte des casquettes vert

millon !!!!
;o))) vertes millonnes serait incompréhensible ...

--
;o)))
@+

Les news à la source !!!
news://news.microsoft.com/microsoft.public.fr.excel
et répondez OUI

n'oubliez pas les FAQ :http://www.excelabo.net
http://dj.joss.free.fr/faq.htm
http://www.faqoe.com http://faqword.free.fr

Avatar
Thierry Fontenelle [MSFT]
Bonjour et merci à tous pour les commentaires. Effectivement, rouge et foncé
seront invariables. Ce problème n’est pas encore traité dans le correcteur et
je le note pour voir ce qu’on pourra faire dans une prochaine version. C’est
loin d’être facile, vu toutes les ambigüités possibles et tous les problèmes
sémantiques de l’interprétation de « tomate » dans les autres exemples que
vous donnez (pas évident de faire comprendre à la machine que « tomate » fait
parfois référence à un fruit, mais parfois aussi uniquement à la couleur ou
la nuance).

A propos, tout ceci n’a rien à voir avec le correcteur orthographique, mais
bien avec le correcteur grammatical (juste pour la petite histoire). Tout
ceci me fait songer qu’il faudra que je décrive un peu plus en détail les
types de fautes qu’on corrige dans le nouveau correcteur grammatical. J’ai eu
tendance à surtout parler du correcteur orthographique, vu que beaucoup de
gens s’intéressaient aux rectifications orthographiques et à la féminisation
des noms de métiers… J’essaierai de faire cela dans les prochaines semaines
pour notre blog….

Bien à vous,

Thierry

Thierry Fontenelle [MSFT]
Microsoft Speech & Natural Language





"Anacoluthe" wrote:

Bonjour !

'Jean-Pierre FORESTIER' nous a écrit ...
C'est le rouge qui est foncé ! A moins que tu dises UNE rouge ???


Ben oui mais c'est un peu plus compliqué avec les couleurs :-)

Rouge seul s'accorde :
- Des casquettes rouges (pluriel de casquettes)
- Des casquettes de couleur rouge (singulier de couleur)

Rouge est invariable si associé à un adjectif ou un substantif de nuance
- Des casquettes rouge foncé
- Des casquettes rouge tomate

Je ne crois pas que la règle ait été modifiée dans la nouvelle
orthographe...

La question resterait hors-sujet dans ce forum Word si on ne
remarquait que le vérificateur Word semble bien perdu sur
ce coup... :-)
Peut-être notre spécialiste MSFT Thierry Fontenelle viendra nous
en dire plus ; ses interventions sont toujours appréciées ici ;-)

Anacoluthe
« L’orthographe est une forme de politesse. »
- ALAIN




Avatar
Anacoluthe
Bonjour !

'Thierry Fontenelle [MSFT]' nous a écrit ...
Bonjour et merci à tous pour les commentaires. Effectivement, rouge et foncé
seront invariables. Ce problème n’est pas encore traité dans le correcteur et
je le note pour voir ce qu’on pourra faire dans une prochaine version. C’est
loin d’être facile, vu toutes les ambigüités possibles et tous les problèmes
sémantiques de l’interprétation de « tomate » dans les autres exemples que
vous donnez (pas évident de faire comprendre à la machine que « tomate » fait
parfois référence à un fruit, mais parfois aussi uniquement à la couleur ou
la nuance).

A propos, tout ceci n’a rien à voir avec le correcteur orthographique, mais
bien avec le correcteur grammatical (juste pour la petite histoire). Tout
ceci me fait songer qu’il faudra que je décrive un peu plus en détail les
types de fautes qu’on corrige dans le nouveau correcteur grammatical. J’ai eu
tendance à surtout parler du correcteur orthographique, vu que beaucoup de
gens s’intéressaient aux rectifications orthographiques et à la féminisation
des noms de métiers… J’essaierai de faire cela dans les prochaines semaines
pour notre blog….


Merci Thierry ! :-D

La distinction orthographe-grammaire est en effet importante dans Word
pour qui veut régler au mieux la correction des fautes de langue.

Tu me dis si je me trompe.

Il me semble qu'il faut d'abord distinguer vérificateur et correcteur:
le vérificateur détecte des fautes, le correcteur corrige ou aide à
corriger des fautes.

Pour les fautes d'orthographe il existe dans Word deux fonctions
correctrices : le correcteur par 'suggestions' et le correcteur
automatique.

Si j'écris 'des casquêtes' le vérificateur signale une faute
d'orthographe car 'casquête' ne fait partie d'aucun dictionnaire
de la langue en cours (dictionnaire Word ou dictionnaire personnel).

Le correcteur, dont l’algorithme de recherche dans les dictionnaires
est parfois défaillant – par exemple pour caskettes ;-) - va me
proposer casquettes, casquettés, casquâtes, caquètes, casquées
et je peux aussi dans le menu contextuel de 'casquêtes' définir en
un clic une correction automatique sur casquettes de façon
à ce que Word me corrige cette faute tout seul à l’avenir.

Ça c’est l’orthographe (dans un sens assez restreint donc!).
Toutes les autres fautes relèvent pour Word du vérificateur
et du correcteur grammatical :
‘des casquette’ est une faute de grammaire pour Word et
le correcteur propose bien 'des casquettes' au pluriel.
‘des casquettes verte foncés’ ne contient aucune faute
d’orthographe pour Word puisque les 4 mots existent.
Il me détecte une faute de grammaire et me propose
d’écrire ‘des casquettes vertes’ ce qui serait juste si
elles n’étaient pas foncées :-) C’est là que c’est très
difficile pour le vérificateur, il faudrait écrire
‘des casquettes vert foncé’

Alors bon courage Thierry !!!!!!!!!

Anacoluthe
« L’orthographe est une forme de politesse. »
- ALAIN

Avatar
Thierry Fontenelle [MSFT]
Bonjour Anacoluthe,

Très bonne analyse. Je n’aurais pas beaucoup de choses à ajouter.
Effectivement, les correcteurs (tant l’orthographique que le grammatical) ont
deux fonctions : identifier les fautes en les soulignant (en rouge pour le
vérificateur orthographique, en vert pour les fautes d’ordre grammatical),
mais aussi proposer des suggestions (en essayant de se tromper le moins
possibles, donc en tentant de comprendre ce que l’utilisateur avait
réellement l’intention d’écrire).

Les suggestions offertes par le correcteur orthographique sont généralement
basées sur le concept de distance d’édition, qui calcule le nombre de
manipulations nécessaires pour retrouver, à partir d’un input erroné, une
chaine de caractères dans le dictionnaire qu’il s’agit de proposer à
l’utilisateur. Parmi ces manipulations on trouvera notamment :

Suppression d’un caractère : débonaire -> débonnaire
Ajout d’un caractère : mourrir -> mourir
Permutation : Chiarc -> Chirac
Remplacement : indépendemment -> indépendamment

Cela, c’est pour le principe général qu’on peut appliquer à quasiment toutes
les langues (du moins pour nos alphabets). On ajoutera des connaissances plus
« spécifiques » à une langue, par exemple pour tenir compte du fait que des
utilisateurs ne se rendent pas compte que le son /f/ s’écrit parfois [ph] en
français : remplacer ‘f’ par ‘ph’ pour corriger éléfant en « éléphant » n’est
donc pas si simple car la distance d’édition est assez longue (l’utilisateur
ayant supprimé deux lettres, p et h, pour ajouter une autre, le f). A la
rigueur, avec ce système, on pourrait même se dire que le mot ‘élégant’ est
plus proche, puisqu’il s’agit juste de remplacer une lettre par une autre
pour passer de ‘éléfant’ à ‘élégant’. On voit donc le problème. C’est ce qui
explique que, dans le correcteur de Word, si vous tapez ‘éléfant’, vous
verrez ‘éléphant ‘ en première position parce que l’algorithme a calculé que
c’était probablement la correction la plus vraisemblable. Mais ce n’est pas
la seule correction possible et il se peut que, dans d’autres contextes,
l’utilisateur ait en fait *voulu* taper ‘élégant’ : le ‘f’ et le ‘g’ étant
voisin sur le clavier, c’est une faute tout à fait possible. Cela explique la
présence du mot ‘élégant’ dans la liste des suggestions offertes pour
‘éléfant’. Nous devons donc aussi tenter de modéliser les fautes les plus
fréquentes. On a ainsi remarqué que la transformation d’un [ph] en [f] est
une faute fréquente, plus fréquente que le passage de [qu] en [k] (qui permet
d’expliquer caskette). Dans ce dernier cas, l’algorithme a effectivement
constaté que ‘cassette’ est plus ‘proche’ de ‘caskette’ (1 lettre de
décalage) que ‘casquette’. Mais ça peut effectivement toujours s’améliorer en
accordant une plus grande priorité à k->qu si on constate que c’est très
fréquent.

On peut aussi effectivement court-circuiter ces algorithmes en ajoutant aux
listes de corrections automatiques des erreurs très fréquentes (qui peuvent
même concerner deux mots distincts). On se rend compte que beaucoup de gens
écrivent ‘synonime’ : plutôt que de souligner le mot, on peut le corriger
automatiquement parce que la probabilité est extrêmement élevée (quasiment
égale à 1) que l’utilisateur ait voulu écrire ‘synonyme’.

Passionnant, n’est-il pas ? ;-))

Thierry

Thierry Fontenelle [MSFT]



Bonjour !

'Thierry Fontenelle [MSFT]' nous a écrit ...
Bonjour et merci à tous pour les commentaires. Effectivement, rouge et foncé
seront invariables. Ce problème n’est pas encore traité dans le correcteur et
je le note pour voir ce qu’on pourra faire dans une prochaine version. C’est
loin d’être facile, vu toutes les ambigüités possibles et tous les problèmes
sémantiques de l’interprétation de « tomate » dans les autres exemples que
vous donnez (pas évident de faire comprendre à la machine que « tomate » fait
parfois référence à un fruit, mais parfois aussi uniquement à la couleur ou
la nuance).

A propos, tout ceci n’a rien à voir avec le correcteur orthographique, mais
bien avec le correcteur grammatical (juste pour la petite histoire). Tout
ceci me fait songer qu’il faudra que je décrive un peu plus en détail les
types de fautes qu’on corrige dans le nouveau correcteur grammatical. J’ai eu
tendance à surtout parler du correcteur orthographique, vu que beaucoup de
gens s’intéressaient aux rectifications orthographiques et à la féminisation
des noms de métiers… J’essaierai de faire cela dans les prochaines semaines
pour notre blog….


Merci Thierry ! :-D

La distinction orthographe-grammaire est en effet importante dans Word
pour qui veut régler au mieux la correction des fautes de langue.

Tu me dis si je me trompe.

Il me semble qu'il faut d'abord distinguer vérificateur et correcteur:
le vérificateur détecte des fautes, le correcteur corrige ou aide à
corriger des fautes.

Pour les fautes d'orthographe il existe dans Word deux fonctions
correctrices : le correcteur par 'suggestions' et le correcteur
automatique.

Si j'écris 'des casquêtes' le vérificateur signale une faute
d'orthographe car 'casquête' ne fait partie d'aucun dictionnaire
de la langue en cours (dictionnaire Word ou dictionnaire personnel).

Le correcteur, dont l’algorithme de recherche dans les dictionnaires
est parfois défaillant – par exemple pour caskettes ;-) - va me
proposer casquettes, casquettés, casquâtes, caquètes, casquées
et je peux aussi dans le menu contextuel de 'casquêtes' définir en
un clic une correction automatique sur casquettes de façon
à ce que Word me corrige cette faute tout seul à l’avenir.

Ça c’est l’orthographe (dans un sens assez restreint donc!).
Toutes les autres fautes relèvent pour Word du vérificateur
et du correcteur grammatical :
‘des casquette’ est une faute de grammaire pour Word et
le correcteur propose bien 'des casquettes' au pluriel.
‘des casquettes verte foncés’ ne contient aucune faute
d’orthographe pour Word puisque les 4 mots existent.
Il me détecte une faute de grammaire et me propose
d’écrire ‘des casquettes vertes’ ce qui serait juste si
elles n’étaient pas foncées :-) C’est là que c’est très
difficile pour le vérificateur, il faudrait écrire
‘des casquettes vert foncé’

Alors bon courage Thierry !!!!!!!!!

Anacoluthe
« L’orthographe est une forme de politesse. »
- ALAIN




Avatar
Lempel
Un bon correcteur devrait intégrer une fonction d'autoapprentissage.
Ce n'est pas facile car il faut bien tenir compte des insuffisances des
utilisateurs.
La solution serait peut-être, lors de la phase de développement, de le faire
passer par une phase d'auto apprentissage en lui faisant corriger des textes
de référence, ceux d'auteurs reconnus pour les qualités de leurs textes.
D'autre part des dictionnaires techniques devraient être intégrés et
devraient pouvoir être complétés par les utilisateurs. Certains correcteurs
proposent déjà cette fonctionnalité.
Personnellement j'utilise Cordial depuis longtemps, mais je constate que le
correcteur de MS n'est pas mal non plus, quoique moins complet.

--
http://lempel.net
B. Lempel
______________________________________


"Thierry Fontenelle [MSFT]"
a écrit dans le message de
news:
| Bonjour Anacoluthe,
|
| Très bonne analyse. Je n'aurais pas beaucoup de choses à ajouter.
| Effectivement, les correcteurs (tant l'orthographique que le grammatical)
ont
| deux fonctions : identifier les fautes en les soulignant (en rouge pour le
| vérificateur orthographique, en vert pour les fautes d'ordre grammatical),
| mais aussi proposer des suggestions (en essayant de se tromper le moins
| possibles, donc en tentant de comprendre ce que l'utilisateur avait
| réellement l'intention d'écrire).
|
| Les suggestions offertes par le correcteur orthographique sont
généralement
| basées sur le concept de distance d'édition, qui calcule le nombre de
| manipulations nécessaires pour retrouver, à partir d'un input erroné, une
| chaine de caractères dans le dictionnaire qu'il s'agit de proposer à
| l'utilisateur. Parmi ces manipulations on trouvera notamment :
|
| Suppression d'un caractère : débonaire -> débonnaire
| Ajout d'un caractère : mourrir -> mourir
| Permutation : Chiarc -> Chirac
| Remplacement : indépendemment -> indépendamment
|
| Cela, c'est pour le principe général qu'on peut appliquer à quasiment
toutes
| les langues (du moins pour nos alphabets). On ajoutera des connaissances
plus
| « spécifiques » à une langue, par exemple pour tenir compte du fait que
des
| utilisateurs ne se rendent pas compte que le son /f/ s'écrit parfois [ph]
en
| français : remplacer 'f' par 'ph' pour corriger éléfant en « éléphant » n'est
| donc pas si simple car la distance d'édition est assez longue (l'utilisateur
| ayant supprimé deux lettres, p et h, pour ajouter une autre, le f). A la
| rigueur, avec ce système, on pourrait même se dire que le mot 'élégant'
est
| plus proche, puisqu'il s'agit juste de remplacer une lettre par une autre
| pour passer de 'éléfant' à 'élégant'. On voit donc le problème. C'est ce
qui
| explique que, dans le correcteur de Word, si vous tapez 'éléfant', vous
| verrez 'éléphant ' en première position parce que l'algorithme a calculé
que
| c'était probablement la correction la plus vraisemblable. Mais ce n'est
pas
| la seule correction possible et il se peut que, dans d'autres contextes,
| l'utilisateur ait en fait *voulu* taper 'élégant' : le 'f' et le 'g' étant
| voisin sur le clavier, c'est une faute tout à fait possible. Cela explique
la
| présence du mot 'élégant' dans la liste des suggestions offertes pour
| 'éléfant'. Nous devons donc aussi tenter de modéliser les fautes les plus
| fréquentes. On a ainsi remarqué que la transformation d'un [ph] en [f] est
| une faute fréquente, plus fréquente que le passage de [qu] en [k] (qui
permet
| d'expliquer caskette). Dans ce dernier cas, l'algorithme a effectivement
| constaté que 'cassette' est plus 'proche' de 'caskette' (1 lettre de
| décalage) que 'casquette'. Mais ça peut effectivement toujours s'améliorer
en
| accordant une plus grande priorité à k->qu si on constate que c'est très
| fréquent.
|
| On peut aussi effectivement court-circuiter ces algorithmes en ajoutant
aux
| listes de corrections automatiques des erreurs très fréquentes (qui
peuvent
| même concerner deux mots distincts). On se rend compte que beaucoup de
gens
| écrivent 'synonime' : plutôt que de souligner le mot, on peut le corriger
| automatiquement parce que la probabilité est extrêmement élevée (quasiment
| égale à 1) que l'utilisateur ait voulu écrire 'synonyme'.
|
| Passionnant, n'est-il pas ? ;-))
|
| Thierry
|
| Thierry Fontenelle [MSFT]
|
|
|
| > Bonjour !
| >
| > 'Thierry Fontenelle [MSFT]' nous a écrit ...
| > > Bonjour et merci à tous pour les commentaires. Effectivement, rouge et
foncé
| > > seront invariables. Ce problème n'est pas encore traité dans le
correcteur et
| > > je le note pour voir ce qu'on pourra faire dans une prochaine version.
C'est
| > > loin d'être facile, vu toutes les ambigüités possibles et tous les
problèmes
| > > sémantiques de l'interprétation de « tomate » dans les autres exemples
que
| > > vous donnez (pas évident de faire comprendre à la machine que «
tomate » fait
| > > parfois référence à un fruit, mais parfois aussi uniquement à la
couleur ou
| > > la nuance).
| > >
| > > A propos, tout ceci n'a rien à voir avec le correcteur orthographique,
mais
| > > bien avec le correcteur grammatical (juste pour la petite histoire).
Tout
| > > ceci me fait songer qu'il faudra que je décrive un peu plus en détail
les
| > > types de fautes qu'on corrige dans le nouveau correcteur grammatical.
J'ai eu
| > > tendance à surtout parler du correcteur orthographique, vu que
beaucoup de
| > > gens s'intéressaient aux rectifications orthographiques et à la
féminisation
| > > des noms de métiers. J'essaierai de faire cela dans les prochaines
semaines
| > > pour notre blog..
| >
| > Merci Thierry ! :-D
| >
| > La distinction orthographe-grammaire est en effet importante dans Word
| > pour qui veut régler au mieux la correction des fautes de langue.
| >
| > Tu me dis si je me trompe.
| >
| > Il me semble qu'il faut d'abord distinguer vérificateur et correcteur:
| > le vérificateur détecte des fautes, le correcteur corrige ou aide à
| > corriger des fautes.
| >
| > Pour les fautes d'orthographe il existe dans Word deux fonctions
| > correctrices : le correcteur par 'suggestions' et le correcteur
| > automatique.
| >
| > Si j'écris 'des casquêtes' le vérificateur signale une faute
| > d'orthographe car 'casquête' ne fait partie d'aucun dictionnaire
| > de la langue en cours (dictionnaire Word ou dictionnaire personnel).
| >
| > Le correcteur, dont l'algorithme de recherche dans les dictionnaires
| > est parfois défaillant - par exemple pour caskettes ;-) - va me
| > proposer casquettes, casquettés, casquâtes, caquètes, casquées
| > et je peux aussi dans le menu contextuel de 'casquêtes' définir en
| > un clic une correction automatique sur casquettes de façon
| > à ce que Word me corrige cette faute tout seul à l'avenir.
| >
| > Ça c'est l'orthographe (dans un sens assez restreint donc!).
| > Toutes les autres fautes relèvent pour Word du vérificateur
| > et du correcteur grammatical :
| > 'des casquette' est une faute de grammaire pour Word et
| > le correcteur propose bien 'des casquettes' au pluriel.
| > 'des casquettes verte foncés' ne contient aucune faute
| > d'orthographe pour Word puisque les 4 mots existent.
| > Il me détecte une faute de grammaire et me propose
| > d'écrire 'des casquettes vertes' ce qui serait juste si
| > elles n'étaient pas foncées :-) C'est là que c'est très
| > difficile pour le vérificateur, il faudrait écrire
| > 'des casquettes vert foncé'
| >
| > Alors bon courage Thierry !!!!!!!!!
| >
| > Anacoluthe
| > « L'orthographe est une forme de politesse. »
| > - ALAIN
| >
Avatar
Anacoluthe
Bonjour Thierry !

'Thierry Fontenelle [MSFT]' nous a écrit ...
Passionnant, n’est-il pas ? ;-))


Absolument :-D
M'est avis que même pour le correcteur orthographique - car je suppose
que pour la correction dite grammaticale les algorithmes sont encore
plus variés et complexes - vous n'allez pas chômer car comme tu le dis
les fautes 'évoluent' : imagine un peu ce que ça sera quand les
utilisateurs voudront pouvoir écrire en phonétique ou en sms !!!!!!!
L'usine à gaz !! Bah juste de quoi justifier pour la bureautique
des processeurs à 10 GHz.... ;-) )))

A+
A~

Avatar
Daniel CEUPPENS
Bonsoir,

"Modeste" a écrit dans le message de news:

Bonsour® Anacoluthe avec ferveur ;o))) vous nous disiez :

Rouge est invariable si associé à un adjectif ou un substantif de nuance
- Des casquettes rouge tomate
une nuance qui fait la différence, en quelque sorte des casquettes vert

millon !!!!

;o))) vertes millonnes serait incompréhensible ...


Attention, ne pas confondre vert million (en $$$) avec vermillon, la couleur
du tmbre français le plus recherché



--
;o)))
@+

Les news à la source !!!
news://news.microsoft.com/microsoft.public.fr.excel
et répondez OUI

n'oubliez pas les FAQ :http://www.excelabo.net
http://dj.joss.free.fr/faq.htm
http://www.faqoe.com http://faqword.free.fr





Avatar
Thierry Fontenelle [MSFT]
Bonjour,

Demander à l’utilisateur de taper des textes en grandes quantités pose
sûrement un gros problème. On ne peut entraîner un logiciel avec deux ou
trois pages uniquement (les modèles statistiques réclament des millions de
mots et la variété de textes que chaque utilisateur est susceptible de taper
est très grande). Nous utilisons des corpus de centaines de millions de mots
pour nos développements, mais on ne peut évidemment pas demander à chaque
utilisateur individuel de fournir sa propre prose dans les mêmes proportions
(aucun n’accepterait). Mais on peut creuser cette question de
l'autoapprentissage, bien sûr (tout le problème est de ne pas ennuyer
l'utilisateur qui n'a généralement pas de temps à perdre).

S’agissant des dictionnaires spécialisés en français, vous y avez accès avec
les versions françaises d’Office : vous pouvez ajouter des dictionnaires de
chimie, de droit, de construction, de termes techniques, de médecine. Vous
les ajoutez via les options vous permettant de charger votre dictionnaire
personnel (batimt.lex pour le dictionnaire de la construction, medic.lex pour
le dico médical, jurid.lex pour les termes juridiques, techni.lex pour les
termes techniques…). Et, bien sûr, vous pouvez aussi enrichir votre
dictionnaire personnel.

S’agissant des correcteurs indépendants, effectivement, il en existe
d’autres. Les différences les plus importantes se situent généralement au
niveau des « fausses alertes » (je l’ai déjà évoqué précédemment sur ce
forum). Plus on essaie de « ratisser large » et de détecter un grand nombre
de fautes, plus on se trompe (et les différences peuvent être énormes). Nous
essayons de travailler dans un domaine de haute précision, c’est-à-dire de
nous tromper le moins souvent possible pour ne pas irriter l’utilisateur en
soulignant à tort et à travers… Dans la dernière version du correcteur
grammatical, nous avons réussi à encore améliorer cette précision en gardant
un très faible taux de fausses alertes, mais en capturant beaucoup plus de
fautes que dans la version précédente d'Office XP. Mais le développement de
ce genre de produit n'est jamais fini, bien sûr... Je vais (entre autres
choses) parler de tout cela au congrès de TALN dans quelques semaines…
http://blogs.msdn.com/correcteurorthographiqueoffice/archive/2006/03/04/543435.aspx

:-)

Thierry

Thierry Fontenelle [MSFT]
Microsoft Speech & Natural Language Group



Un bon correcteur devrait intégrer une fonction d'autoapprentissage.
Ce n'est pas facile car il faut bien tenir compte des insuffisances des
utilisateurs.
La solution serait peut-être, lors de la phase de développement, de le faire
passer par une phase d'auto apprentissage en lui faisant corriger des textes
de référence, ceux d'auteurs reconnus pour les qualités de leurs textes.
D'autre part des dictionnaires techniques devraient être intégrés et
devraient pouvoir être complétés par les utilisateurs. Certains correcteurs
proposent déjà cette fonctionnalité.
Personnellement j'utilise Cordial depuis longtemps, mais je constate que le
correcteur de MS n'est pas mal non plus, quoique moins complet.

--
http://lempel.net
B. Lempel
______________________________________


"Thierry Fontenelle [MSFT]"
a écrit dans le message de
news:
| Bonjour Anacoluthe,
|
| Très bonne analyse. Je n'aurais pas beaucoup de choses à ajouter.
| Effectivement, les correcteurs (tant l'orthographique que le grammatical)
ont
| deux fonctions : identifier les fautes en les soulignant (en rouge pour le
| vérificateur orthographique, en vert pour les fautes d'ordre grammatical),
| mais aussi proposer des suggestions (en essayant de se tromper le moins
| possibles, donc en tentant de comprendre ce que l'utilisateur avait
| réellement l'intention d'écrire).
|
| Les suggestions offertes par le correcteur orthographique sont
généralement
| basées sur le concept de distance d'édition, qui calcule le nombre de
| manipulations nécessaires pour retrouver, à partir d'un input erroné, une
| chaine de caractères dans le dictionnaire qu'il s'agit de proposer à
| l'utilisateur. Parmi ces manipulations on trouvera notamment :
|
| Suppression d'un caractère : débonaire -> débonnaire
| Ajout d'un caractère : mourrir -> mourir
| Permutation : Chiarc -> Chirac
| Remplacement : indépendemment -> indépendamment
|
| Cela, c'est pour le principe général qu'on peut appliquer à quasiment
toutes
| les langues (du moins pour nos alphabets). On ajoutera des connaissances
plus
| « spécifiques » à une langue, par exemple pour tenir compte du fait que
des
| utilisateurs ne se rendent pas compte que le son /f/ s'écrit parfois [ph]
en
| français : remplacer 'f' par 'ph' pour corriger éléfant en « éléphant » n'est
| donc pas si simple car la distance d'édition est assez longue (l'utilisateur
| ayant supprimé deux lettres, p et h, pour ajouter une autre, le f). A la
| rigueur, avec ce système, on pourrait même se dire que le mot 'élégant'
est
| plus proche, puisqu'il s'agit juste de remplacer une lettre par une autre
| pour passer de 'éléfant' à 'élégant'. On voit donc le problème. C'est ce
qui
| explique que, dans le correcteur de Word, si vous tapez 'éléfant', vous
| verrez 'éléphant ' en première position parce que l'algorithme a calculé
que
| c'était probablement la correction la plus vraisemblable. Mais ce n'est
pas
| la seule correction possible et il se peut que, dans d'autres contextes,
| l'utilisateur ait en fait *voulu* taper 'élégant' : le 'f' et le 'g' étant
| voisin sur le clavier, c'est une faute tout à fait possible. Cela explique
la
| présence du mot 'élégant' dans la liste des suggestions offertes pour
| 'éléfant'. Nous devons donc aussi tenter de modéliser les fautes les plus
| fréquentes. On a ainsi remarqué que la transformation d'un [ph] en [f] est
| une faute fréquente, plus fréquente que le passage de [qu] en [k] (qui
permet
| d'expliquer caskette). Dans ce dernier cas, l'algorithme a effectivement
| constaté que 'cassette' est plus 'proche' de 'caskette' (1 lettre de
| décalage) que 'casquette'. Mais ça peut effectivement toujours s'améliorer
en
| accordant une plus grande priorité à k->qu si on constate que c'est très
| fréquent.
|
| On peut aussi effectivement court-circuiter ces algorithmes en ajoutant
aux
| listes de corrections automatiques des erreurs très fréquentes (qui
peuvent
| même concerner deux mots distincts). On se rend compte que beaucoup de
gens
| écrivent 'synonime' : plutôt que de souligner le mot, on peut le corriger
| automatiquement parce que la probabilité est extrêmement élevée (quasiment
| égale à 1) que l'utilisateur ait voulu écrire 'synonyme'.
|
| Passionnant, n'est-il pas ? ;-))
|
| Thierry
|
| Thierry Fontenelle [MSFT]
|
|
|
| > Bonjour !
| >
| > 'Thierry Fontenelle [MSFT]' nous a écrit ...
| > > Bonjour et merci à tous pour les commentaires. Effectivement, rouge et
foncé
| > > seront invariables. Ce problème n'est pas encore traité dans le
correcteur et
| > > je le note pour voir ce qu'on pourra faire dans une prochaine version.
C'est
| > > loin d'être facile, vu toutes les ambigüités possibles et tous les
problèmes
| > > sémantiques de l'interprétation de « tomate » dans les autres exemples
que
| > > vous donnez (pas évident de faire comprendre à la machine que «
tomate » fait
| > > parfois référence à un fruit, mais parfois aussi uniquement à la
couleur ou
| > > la nuance).
| > >
| > > A propos, tout ceci n'a rien à voir avec le correcteur orthographique,
mais
| > > bien avec le correcteur grammatical (juste pour la petite histoire).
Tout
| > > ceci me fait songer qu'il faudra que je décrive un peu plus en détail
les
| > > types de fautes qu'on corrige dans le nouveau correcteur grammatical.
J'ai eu
| > > tendance à surtout parler du correcteur orthographique, vu que
beaucoup de
| > > gens s'intéressaient aux rectifications orthographiques et à la
féminisation
| > > des noms de métiers. J'essaierai de faire cela dans les prochaines
semaines
| > > pour notre blog..
| >
| > Merci Thierry ! :-D
| >
| > La distinction orthographe-grammaire est en effet importante dans Word
| > pour qui veut régler au mieux la correction des fautes de langue.
| >
| > Tu me dis si je me trompe.
| >
| > Il me semble qu'il faut d'abord distinguer vérificateur et correcteur:
| > le vérificateur détecte des fautes, le correcteur corrige ou aide à
| > corriger des fautes.
| >
| > Pour les fautes d'orthographe il existe dans Word deux fonctions
| > correctrices : le correcteur par 'suggestions' et le correcteur
| > automatique.
| >
| > Si j'écris 'des casquêtes' le vérificateur signale une faute
| > d'orthographe car 'casquête' ne fait partie d'aucun dictionnaire
| > de la langue en cours (dictionnaire Word ou dictionnaire personnel).
| >
| > Le correcteur, dont l'algorithme de recherche dans les dictionnaires
| > est parfois défaillant - par exemple pour caskettes ;-) - va me
| > proposer casquettes, casquettés, casquâtes, caquètes, casquées
| > et je peux aussi dans le menu contextuel de 'casquêtes' définir en
| > un clic une correction automatique sur casquettes de façon
| > à ce que Word me corrige cette faute tout seul à l'avenir.
| >
| > Ça c'est l'orthographe (dans un sens assez restreint donc!).
| > Toutes les autres fautes relèvent pour Word du vérificateur
| > et du correcteur grammatical :
| > 'des casquette' est une faute de grammaire pour Word et
| > le correcteur propose bien 'des casquettes' au pluriel.
| > 'des casquettes verte foncés' ne contient aucune faute
| > d'orthographe pour Word puisque les 4 mots existent.
| > Il me détecte une faute de grammaire et me propose
| > d'écrire 'des casquettes vertes' ce qui serait juste si
| > elles n'étaient pas foncées :-) C'est là que c'est très
| > difficile pour le vérificateur, il faudrait écrire
| > 'des casquettes vert foncé'
| >
| > Alors bon courage Thierry !!!!!!!!!
| >
| > Anacoluthe
| > « L'orthographe est une forme de politesse. »
| > - ALAIN
| >





Avatar
Lempel
Ah si la majorité des Français avaient déjà une bonne connaissance de leur
langue natale, tout serait plus facile.
:-)

Merci à ceux qui font cet effort de nous aider à mieux parler et à mieux
écrire.

--
http://lempel.net
B. Lempel
______________________________________


"Thierry Fontenelle [MSFT]"
a écrit dans le message de
news:
| Bonjour,
|
| Demander à l'utilisateur de taper des textes en grandes quantités pose
| sûrement un gros problème. On ne peut entraîner un logiciel avec deux ou
| trois pages uniquement (les modèles statistiques réclament des millions de
| mots et la variété de textes que chaque utilisateur est susceptible de
taper
| est très grande). Nous utilisons des corpus de centaines de millions de
mots
| pour nos développements, mais on ne peut évidemment pas demander à chaque
| utilisateur individuel de fournir sa propre prose dans les mêmes
proportions
| (aucun n'accepterait). Mais on peut creuser cette question de
| l'autoapprentissage, bien sûr (tout le problème est de ne pas ennuyer
| l'utilisateur qui n'a généralement pas de temps à perdre).
|
| S'agissant des dictionnaires spécialisés en français, vous y avez accès
avec
| les versions françaises d'Office : vous pouvez ajouter des dictionnaires
de
| chimie, de droit, de construction, de termes techniques, de médecine. Vous
| les ajoutez via les options vous permettant de charger votre dictionnaire
| personnel (batimt.lex pour le dictionnaire de la construction, medic.lex
pour
| le dico médical, jurid.lex pour les termes juridiques, techni.lex pour les
| termes techniques.). Et, bien sûr, vous pouvez aussi enrichir votre
| dictionnaire personnel.
|
| S'agissant des correcteurs indépendants, effectivement, il en existe
| d'autres. Les différences les plus importantes se situent généralement au
| niveau des « fausses alertes » (je l'ai déjà évoqué précédemment sur ce
| forum). Plus on essaie de « ratisser large » et de détecter un grand
nombre
| de fautes, plus on se trompe (et les différences peuvent être énormes).
Nous
| essayons de travailler dans un domaine de haute précision, c'est-à-dire de
| nous tromper le moins souvent possible pour ne pas irriter l'utilisateur
en
| soulignant à tort et à travers. Dans la dernière version du correcteur
| grammatical, nous avons réussi à encore améliorer cette précision en
gardant
| un très faible taux de fausses alertes, mais en capturant beaucoup plus de
| fautes que dans la version précédente d'Office XP. Mais le développement
de
| ce genre de produit n'est jamais fini, bien sûr... Je vais (entre autres
| choses) parler de tout cela au congrès de TALN dans quelques semaines.
|
http://blogs.msdn.com/correcteurorthographiqueoffice/archive/2006/03/04/543435.aspx
|
| :-)
|
| Thierry
|
| Thierry Fontenelle [MSFT]
| Microsoft Speech & Natural Language Group
|
|
|
| > Un bon correcteur devrait intégrer une fonction d'autoapprentissage.
| > Ce n'est pas facile car il faut bien tenir compte des insuffisances des
| > utilisateurs.
| > La solution serait peut-être, lors de la phase de développement, de le
faire
| > passer par une phase d'auto apprentissage en lui faisant corriger des
textes
| > de référence, ceux d'auteurs reconnus pour les qualités de leurs textes.
| > D'autre part des dictionnaires techniques devraient être intégrés et
| > devraient pouvoir être complétés par les utilisateurs. Certains
correcteurs
| > proposent déjà cette fonctionnalité.
| > Personnellement j'utilise Cordial depuis longtemps, mais je constate que
le
| > correcteur de MS n'est pas mal non plus, quoique moins complet.
| >
| > --
| > http://lempel.net
| > B. Lempel
| > ______________________________________
| >
| >
| > "Thierry Fontenelle [MSFT]"
| > a écrit dans le
message de
| > news:
| > | Bonjour Anacoluthe,
| > |
| > | Très bonne analyse. Je n'aurais pas beaucoup de choses à ajouter.
| > | Effectivement, les correcteurs (tant l'orthographique que le
grammatical)
| > ont
| > | deux fonctions : identifier les fautes en les soulignant (en rouge
pour le
| > | vérificateur orthographique, en vert pour les fautes d'ordre
grammatical),
| > | mais aussi proposer des suggestions (en essayant de se tromper le
moins
| > | possibles, donc en tentant de comprendre ce que l'utilisateur avait
| > | réellement l'intention d'écrire).
| > |
| > | Les suggestions offertes par le correcteur orthographique sont
| > généralement
| > | basées sur le concept de distance d'édition, qui calcule le nombre de
| > | manipulations nécessaires pour retrouver, à partir d'un input erroné,
une
| > | chaine de caractères dans le dictionnaire qu'il s'agit de proposer à
| > | l'utilisateur. Parmi ces manipulations on trouvera notamment :
| > |
| > | Suppression d'un caractère : débonaire -> débonnaire
| > | Ajout d'un caractère : mourrir -> mourir
| > | Permutation : Chiarc -> Chirac
| > | Remplacement : indépendemment -> indépendamment
| > |
| > | Cela, c'est pour le principe général qu'on peut appliquer à quasiment
| > toutes
| > | les langues (du moins pour nos alphabets). On ajoutera des
connaissances
| > plus
| > | « spécifiques » à une langue, par exemple pour tenir compte du fait
que
| > des
| > | utilisateurs ne se rendent pas compte que le son /f/ s'écrit parfois
[ph]
| > en
| > | français : remplacer 'f' par 'ph' pour corriger éléfant en «
éléphant » n'est
| > | donc pas si simple car la distance d'édition est assez longue
(l'utilisateur
| > | ayant supprimé deux lettres, p et h, pour ajouter une autre, le f). A
la
| > | rigueur, avec ce système, on pourrait même se dire que le mot
'élégant'
| > est
| > | plus proche, puisqu'il s'agit juste de remplacer une lettre par une
autre
| > | pour passer de 'éléfant' à 'élégant'. On voit donc le problème. C'est
ce
| > qui
| > | explique que, dans le correcteur de Word, si vous tapez 'éléfant',
vous
| > | verrez 'éléphant ' en première position parce que l'algorithme a
calculé
| > que
| > | c'était probablement la correction la plus vraisemblable. Mais ce
n'est
| > pas
| > | la seule correction possible et il se peut que, dans d'autres
contextes,
| > | l'utilisateur ait en fait *voulu* taper 'élégant' : le 'f' et le 'g'
étant
| > | voisin sur le clavier, c'est une faute tout à fait possible. Cela
explique
| > la
| > | présence du mot 'élégant' dans la liste des suggestions offertes pour
| > | 'éléfant'. Nous devons donc aussi tenter de modéliser les fautes les
plus
| > | fréquentes. On a ainsi remarqué que la transformation d'un [ph] en [f]
est
| > | une faute fréquente, plus fréquente que le passage de [qu] en [k] (qui
| > permet
| > | d'expliquer caskette). Dans ce dernier cas, l'algorithme a
effectivement
| > | constaté que 'cassette' est plus 'proche' de 'caskette' (1 lettre de
| > | décalage) que 'casquette'. Mais ça peut effectivement toujours
s'améliorer
| > en
| > | accordant une plus grande priorité à k->qu si on constate que c'est
très
| > | fréquent.
| > |
| > | On peut aussi effectivement court-circuiter ces algorithmes en
ajoutant
| > aux
| > | listes de corrections automatiques des erreurs très fréquentes (qui
| > peuvent
| > | même concerner deux mots distincts). On se rend compte que beaucoup de
| > gens
| > | écrivent 'synonime' : plutôt que de souligner le mot, on peut le
corriger
| > | automatiquement parce que la probabilité est extrêmement élevée
(quasiment
| > | égale à 1) que l'utilisateur ait voulu écrire 'synonyme'.
| > |
| > | Passionnant, n'est-il pas ? ;-))
| > |
| > | Thierry
| > |
| > | Thierry Fontenelle [MSFT]
| > |
| > |
| > |
| > | > Bonjour !
| > | >
| > | > 'Thierry Fontenelle [MSFT]' nous a écrit ...
| > | > > Bonjour et merci à tous pour les commentaires. Effectivement,
rouge et
| > foncé
| > | > > seront invariables. Ce problème n'est pas encore traité dans le
| > correcteur et
| > | > > je le note pour voir ce qu'on pourra faire dans une prochaine
version.
| > C'est
| > | > > loin d'être facile, vu toutes les ambigüités possibles et tous les
| > problèmes
| > | > > sémantiques de l'interprétation de « tomate » dans les autres
exemples
| > que
| > | > > vous donnez (pas évident de faire comprendre à la machine que «
| > tomate » fait
| > | > > parfois référence à un fruit, mais parfois aussi uniquement à la
| > couleur ou
| > | > > la nuance).
| > | > >
| > | > > A propos, tout ceci n'a rien à voir avec le correcteur
orthographique,
| > mais
| > | > > bien avec le correcteur grammatical (juste pour la petite
histoire).
| > Tout
| > | > > ceci me fait songer qu'il faudra que je décrive un peu plus en
détail
| > les
| > | > > types de fautes qu'on corrige dans le nouveau correcteur
grammatical.
| > J'ai eu
| > | > > tendance à surtout parler du correcteur orthographique, vu que
| > beaucoup de
| > | > > gens s'intéressaient aux rectifications orthographiques et à la
| > féminisation
| > | > > des noms de métiers. J'essaierai de faire cela dans les prochaines
| > semaines
| > | > > pour notre blog..
| > | >
| > | > Merci Thierry ! :-D
| > | >
| > | > La distinction orthographe-grammaire est en effet importante dans
Word
| > | > pour qui veut régler au mieux la correction des fautes de langue.
| > | >
| > | > Tu me dis si je me trompe.
| > | >
| > | > Il me semble qu'il faut d'abord distinguer vérificateur et
correcteur:
| > | > le vérificateur détecte des fautes, le correcteur corrige ou aide à
| > | > corriger des fautes.
| > | >
| > | > Pour les fautes d'orthographe il existe dans Word deux fonctions
| > | > correctrices : le correcteur par 'suggestions' et le correcteur
| > | > automatique.
| > | >
| > | > Si j'écris 'des casquêtes' le vérificateur signale une faute
| > | > d'orthographe car 'casquête' ne fait partie d'aucun dictionnaire
| > | > de la langue en cours (dictionnaire Word ou dictionnaire personnel).
| > | >
| > | > Le correcteur, dont l'algorithme de recherche dans les dictionnaires
| > | > est parfois défaillant - par exemple pour caskettes ;-) - va me
| > | > proposer casquettes, casquettés, casquâtes, caquètes, casquées
| > | > et je peux aussi dans le menu contextuel de 'casquêtes' définir en
| > | > un clic une correction automatique sur casquettes de façon
| > | > à ce que Word me corrige cette faute tout seul à l'avenir.
| > | >
| > | > Ça c'est l'orthographe (dans un sens assez restreint donc!).
| > | > Toutes les autres fautes relèvent pour Word du vérificateur
| > | > et du correcteur grammatical :
| > | > 'des casquette' est une faute de grammaire pour Word et
| > | > le correcteur propose bien 'des casquettes' au pluriel.
| > | > 'des casquettes verte foncés' ne contient aucune faute
| > | > d'orthographe pour Word puisque les 4 mots existent.
| > | > Il me détecte une faute de grammaire et me propose
| > | > d'écrire 'des casquettes vertes' ce qui serait juste si
| > | > elles n'étaient pas foncées :-) C'est là que c'est très
| > | > difficile pour le vérificateur, il faudrait écrire
| > | > 'des casquettes vert foncé'
| > | >
| > | > Alors bon courage Thierry !!!!!!!!!
| > | >
| > | > Anacoluthe
| > | > « L'orthographe est une forme de politesse. »
| > | > - ALAIN
| > | >
| >
| >
| >
1 2