rechercher mots en majuscule

Le
exagone69
Bonjour

Pour établir un index alphabétique j'ai besoin de rechercher tous les
mots de mon document (sous Word 2007) qui sont en majuscule

Merci de m'aider

Francis Gros
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses Page 1 / 2
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Geo
Le #6410201

Bonjour

Pour établir un index alphabétique j'ai besoin de rechercher tous les mots de mon
document (sous Word 2007) qui sont en majuscule

Merci de m'aider


Regardez la conversation "extraction mots" du 3 avril.
Ça devrait vous donner des orientations.

--
A+

Francis Gros
Le #6410511

Bonjour

Pour établir un index alphabétique j'ai besoin de rechercher tous les
mots de mon document (sous Word 2007) qui sont en majuscule

Merci de m'aider


Regardez la conversation "extraction mots" du 3 avril.
Ça devrait vous donner des orientations.

Bonjour


Oui effectivement
J'ai presque réussi à générer l'index alphabétique que je souhaitais
J'ai juste un petit problème

Pour bien comprendre je reprends l'ensemble du problème
un document sous word 2007 comporte 145 pages
dont voici un court extrait :

381 Agnès NOLHAC ° 1633
+ 28/11/1708 Soucieu-en-Jarrest (69)
382 Benoît GRANJON ° ca 1645
+ 26/07/1684 Soucieu-en-Jarrest (69)
383 x 18/12/1667 Lyon (69)

les numéros, les prénoms et noms sont en caractères arial gras
Il s'agit de réaliser un index alphabétique
J'ai appliqué la méthode préconisée :


1- Rechercher les mots gras et italique (par exemple), et en activant
l'option Surligner tous les éléments trouvés
2- Copier tous les mots trouvés dans un autre document pour en faire un
fichier de concordance
3- Exécuter l'indexation grâce au fichier de concordance grâce au bouton
Marquage auto de la boite de dialogue Index
4- Générer l'index


Quand je fais l'opération 2 "copier" je fais d'abord "sélectionner le
texte ayant une mise en forme semblable"
et j'obtiens :

Agnès NOLHAC
Benoît GRANJON

et à la fin j'ai bien un index alphabétique sur les prénoms
C'est un index alphabétique sur les noms que je voudrai

dans l'opération 1 je n'arrive pas à obtenir seulement les mots en
majuscule.

Sinon la solution préconisée est vraiment géniale
à+

Francis Gros


Dom
Le #6410801
Bonjour,

copie colle la ligne suivante dans le champ Rechercher et coche Utiliser les
caractères génériques :
<[A-Z]{2;}

Word sélectionnera tous les mots qui contiennent au moins les 2 premiers
caractères en majuscules.

Dom



Bonjour

Pour établir un index alphabétique j'ai besoin de rechercher tous les
mots de mon document (sous Word 2007) qui sont en majuscule

Merci de m'aider


Regardez la conversation "extraction mots" du 3 avril.
Ça devrait vous donner des orientations.

Bonjour


Oui effectivement
J'ai presque réussi à générer l'index alphabétique que je souhaitais
J'ai juste un petit problème

Pour bien comprendre je reprends l'ensemble du problème
un document sous word 2007 comporte 145 pages
dont voici un court extrait :

381 Agnès NOLHAC ° 1633
+ 28/11/1708 Soucieu-en-Jarrest (69)
382 Benoît GRANJON ° ca 1645
+ 26/07/1684 Soucieu-en-Jarrest (69)
383 x 18/12/1667 Lyon (69)

les numéros, les prénoms et noms sont en caractères arial gras
Il s'agit de réaliser un index alphabétique
J'ai appliqué la méthode préconisée :


1- Rechercher les mots gras et italique (par exemple), et en activant
l'option Surligner tous les éléments trouvés
2- Copier tous les mots trouvés dans un autre document pour en faire un
fichier de concordance
3- Exécuter l'indexation grâce au fichier de concordance grâce au bouton
Marquage auto de la boite de dialogue Index
4- Générer l'index


Quand je fais l'opération 2 "copier" je fais d'abord "sélectionner le
texte ayant une mise en forme semblable"
et j'obtiens :

Agnès NOLHAC
Benoît GRANJON

et à la fin j'ai bien un index alphabétique sur les prénoms
C'est un index alphabétique sur les noms que je voudrai

dans l'opération 1 je n'arrive pas à obtenir seulement les mots en
majuscule.

Sinon la solution préconisée est vraiment géniale
à+

Francis Gros






Geo
Le #6411141

et j'obtiens :

Agnès NOLHAC
Benoît GRANJON


Un peu bricolage, mais si vous n'avez qu'une fois à le faire :
Remplacer tout caractère suivi d'un espace par un espace.
Le premier coup ça va donner
Agnè NOLHAC
Benoî GRANJON

et répéter autant que nécessaire
Pour aller plus vite vous pouvez au début mettre plusieurs caractères
Rechercher "^?^?^? " (sans les guillemets)
Remplacer " " (sans les guillemets)

Et à la fin pour supprimer l'espace en tête de ligne :
Rechercher "^p " (sans les guillemets)
Remplacer "^p" (sans les guillemets)

--
A+

Circé
Le #6411111
Bonjour Francis et Geo ;),


et j'obtiens :

Agnès NOLHAC
Benoît GRANJON


Un peu bricolage,


Et pourquoi ne pas utiliser une Recherche avec les caractères
génériques ?

Onglet Accueil, groupe Modification (à l'extrême droite du ruban),
bouton Rechercher.

- Clique sur le bouton Plus pour agrandir la boîte de dialogue.
- Coche l'option "Utiliser les caractères génériques"
- Rechercher : <[A-Z]*[A-Z]>
- Bouton Lecture du surlignage : Tout surligner

<[A-Z]*[A-Z]> recherchera tous les mots commençant et se terminant par
une majuscule.

Et Si Francis tu es intéressé par les secrets du recherche-remplace,
c'est ici :
http://faqword.free.fr/articles.php?lng=fr&pg22

Circé
http://faqword.free.fr

mais si vous n'avez qu'une fois à le faire :
Remplacer tout caractère suivi d'un espace par un espace.
Le premier coup ça va donner
Agnè NOLHAC
Benoî GRANJON

et répéter autant que nécessaire
Pour aller plus vite vous pouvez au début mettre plusieurs caractères
Rechercher "^?^?^? " (sans les guillemets)
Remplacer " " (sans les guillemets)

Et à la fin pour supprimer l'espace en tête de ligne :
Rechercher "^p " (sans les guillemets)
Remplacer "^p" (sans les guillemets)



Dom
Le #6411081
------ <[A-Z]*[A-Z]> recherchera tous les mots commençant et se terminant par
une majuscule.

C'est sûr, et même bien plus que seulement les mots entièrement en
majuscules :(

Dom



Bonjour Francis et Geo ;),


et j'obtiens :

Agnès NOLHAC
Benoît GRANJON


Un peu bricolage,


Et pourquoi ne pas utiliser une Recherche avec les caractères
génériques ?

Onglet Accueil, groupe Modification (à l'extrême droite du ruban),
bouton Rechercher.

- Clique sur le bouton Plus pour agrandir la boîte de dialogue.
- Coche l'option "Utiliser les caractères génériques"
- Rechercher : <[A-Z]*[A-Z]>
- Bouton Lecture du surlignage : Tout surligner

<[A-Z]*[A-Z]> recherchera tous les mots commençant et se terminant par
une majuscule.

Et Si Francis tu es intéressé par les secrets du recherche-remplace,
c'est ici :
http://faqword.free.fr/articles.php?lng=fr&pg22

Circé
http://faqword.free.fr

mais si vous n'avez qu'une fois à le faire :
Remplacer tout caractère suivi d'un espace par un espace.
Le premier coup ça va donner
Agnè NOLHAC
Benoî GRANJON

et répéter autant que nécessaire
Pour aller plus vite vous pouvez au début mettre plusieurs caractères
Rechercher "^?^?^? " (sans les guillemets)
Remplacer " " (sans les guillemets)

Et à la fin pour supprimer l'espace en tête de ligne :
Rechercher "^p " (sans les guillemets)
Remplacer "^p" (sans les guillemets)








Thierry Fontenelle [MSFT]
Le #6421081
Bonjour,

Dans ma version, je dois utiliser la virgule et pas le point-virgule pour
indiquer le nombre d’occurrences du patron. J’utiliserais donc :
[A-Z]{2,}
pour repérer les chaines de minimum 2 lettres en majuscules. Vu la fréquence
élevée des apostrophes et articles élidés en français, je conseillerais
probablement de ne pas utiliser le signe < devant l’expression régulière, ce
qui permettra de repérer des mots en majuscules précédés de l’ ou d’, comme
dans l’UNESCO ou l’ONU.

Bon dimanche,

Thierry
Thierry Fontenelle [MSFT]


"Dom" wrote:

Bonjour,

copie colle la ligne suivante dans le champ Rechercher et coche Utiliser les
caractères génériques :
<[A-Z]{2;}

Word sélectionnera tous les mots qui contiennent au moins les 2 premiers
caractères en majuscules.

Dom



Bonjour

Pour établir un index alphabétique j'ai besoin de rechercher tous les
mots de mon document (sous Word 2007) qui sont en majuscule

Merci de m'aider


Regardez la conversation "extraction mots" du 3 avril.
Ça devrait vous donner des orientations.

Bonjour


Oui effectivement
J'ai presque réussi à générer l'index alphabétique que je souhaitais
J'ai juste un petit problème

Pour bien comprendre je reprends l'ensemble du problème
un document sous word 2007 comporte 145 pages
dont voici un court extrait :

381 Agnès NOLHAC ° 1633
+ 28/11/1708 Soucieu-en-Jarrest (69)
382 Benoît GRANJON ° ca 1645
+ 26/07/1684 Soucieu-en-Jarrest (69)
383 x 18/12/1667 Lyon (69)

les numéros, les prénoms et noms sont en caractères arial gras
Il s'agit de réaliser un index alphabétique
J'ai appliqué la méthode préconisée :


1- Rechercher les mots gras et italique (par exemple), et en activant
l'option Surligner tous les éléments trouvés
2- Copier tous les mots trouvés dans un autre document pour en faire un
fichier de concordance
3- Exécuter l'indexation grâce au fichier de concordance grâce au bouton
Marquage auto de la boite de dialogue Index
4- Générer l'index


Quand je fais l'opération 2 "copier" je fais d'abord "sélectionner le
texte ayant une mise en forme semblable"
et j'obtiens :

Agnès NOLHAC
Benoît GRANJON

et à la fin j'ai bien un index alphabétique sur les prénoms
C'est un index alphabétique sur les noms que je voudrai

dans l'opération 1 je n'arrive pas à obtenir seulement les mots en
majuscule.

Sinon la solution préconisée est vraiment géniale
à+

Francis Gros








Dom
Le #6421221
Bonjour,

je maintiens le ";" car il s'agit du séparateur de liste par défaut déclaré
dans les Options régionales et linguistiques du Panneau de configuration de
Windows, au moins pour la France.

Pour la syntaxe de la recherche, tu as attiré mon attention sur la
possibilité de l'apostrophe. Je ne l'utiliserais pas comme toi car dans un
nom de famille (exemple donné par Francis), on aura plus souvent des noms
comme N'GUYEN que n'GUYEN. Mais cela m'a fait pensé aussi au trait d'union
(NOLHAC-DURAND).
Aussi, l'instruction sera plus complète si l'on indique :
<[A-Z;';-]{2;}

Je conserverai le signe <, sinon dans le cas des traits d'union, Word
sélectionnera aussi "-J" (de Soucieu-en-Jarrest dans l'exemple donné).

Ce n'est pas encore parfait mais c'est mieux qu'avant.
Je pense quand même que ce type de recherche (mots en majuscules), loin
d'être un gadget, pourrait être prévu très simplement au même titre que la
recherche sur une police ou une couleur (sans passer obligatoirement par la
capitalisation des caractères du menu Format > Polices).

Merci pour tes remarques qui ont permis d'aller un peu plus loin.

Dom



Bonjour,

Dans ma version, je dois utiliser la virgule et pas le point-virgule pour
indiquer le nombre d’occurrences du patron. J’utiliserais donc :
[A-Z]{2,}
pour repérer les chaines de minimum 2 lettres en majuscules. Vu la fréquence
élevée des apostrophes et articles élidés en français, je conseillerais
probablement de ne pas utiliser le signe < devant l’expression régulière, ce
qui permettra de repérer des mots en majuscules précédés de l’ ou d’, comme
dans l’UNESCO ou l’ONU.

Bon dimanche,

Thierry
Thierry Fontenelle [MSFT]


"Dom" wrote:

Bonjour,

copie colle la ligne suivante dans le champ Rechercher et coche Utiliser les
caractères génériques :
<[A-Z]{2;}

Word sélectionnera tous les mots qui contiennent au moins les 2 premiers
caractères en majuscules.

Dom



Bonjour

Pour établir un index alphabétique j'ai besoin de rechercher tous les
mots de mon document (sous Word 2007) qui sont en majuscule

Merci de m'aider


Regardez la conversation "extraction mots" du 3 avril.
Ça devrait vous donner des orientations.

Bonjour


Oui effectivement
J'ai presque réussi à générer l'index alphabétique que je souhaitais
J'ai juste un petit problème

Pour bien comprendre je reprends l'ensemble du problème
un document sous word 2007 comporte 145 pages
dont voici un court extrait :

381 Agnès NOLHAC ° 1633
+ 28/11/1708 Soucieu-en-Jarrest (69)
382 Benoît GRANJON ° ca 1645
+ 26/07/1684 Soucieu-en-Jarrest (69)
383 x 18/12/1667 Lyon (69)

les numéros, les prénoms et noms sont en caractères arial gras
Il s'agit de réaliser un index alphabétique
J'ai appliqué la méthode préconisée :


1- Rechercher les mots gras et italique (par exemple), et en activant
l'option Surligner tous les éléments trouvés
2- Copier tous les mots trouvés dans un autre document pour en faire un
fichier de concordance
3- Exécuter l'indexation grâce au fichier de concordance grâce au bouton
Marquage auto de la boite de dialogue Index
4- Générer l'index


Quand je fais l'opération 2 "copier" je fais d'abord "sélectionner le
texte ayant une mise en forme semblable"
et j'obtiens :

Agnès NOLHAC
Benoît GRANJON

et à la fin j'ai bien un index alphabétique sur les prénoms
C'est un index alphabétique sur les noms que je voudrai

dans l'opération 1 je n'arrive pas à obtenir seulement les mots en
majuscule.

Sinon la solution préconisée est vraiment géniale
à+

Francis Gros










Circ
Le #6425911
Hello Thierry ;)

Bonjour,

Dans ma version, je dois utiliser la virgule et pas le point-virgule pour
indiquer le nombre d’occurrences du patron. J’utiliserais donc :
[A-Z]{2,}
pour repérer les chaines de minimum 2 lettres en majuscules. Vu la fréquence
élevée des apostrophes et articles élidés en français, je conseillerais
probablement de ne pas utiliser le signe < devant l’expression régulière, ce
qui permettra de repérer des mots en majuscules précédés de l’ ou d’, comme
dans l’UNESCO ou l’ONU.


Je découvre seulement ton post ! Tu as raison, j'ai sauté sur mon
clavier trop vite !!! ;))

Exagone69 qui a posé la question n'a pas l'air plus intéressé que ça
par la réponse... ;) je précise néanmoins pour ceux que ça intéresse
que le signe < indique le début d'un mot et que le signe > indique la
fin d'un mot... Au milieu on peut avoir n'importe quoi... Donc
effectivement l'idée de préciser le nombre minimum de caractères en
majuscules est la bonne.

Il est dommage que la recherche avec les caractères génériques ne
puisse pas se faire sur des mots entiers... Crois-tu qu'il soit
envisageable de penser à ça ?

Bon dimanche,


Euh... bon lundi à toi !!! ;)))

Circé



Thierry
Thierry Fontenelle [MSFT]





Bonjour

Pour établir un index alphabétique j'ai besoin de rechercher tous les
mots de mon document (sous Word 2007) qui sont en majuscule

Merci de m'aider


Regardez la conversation "extraction mots" du 3 avril.
Ça devrait vous donner des orientations.

Bonjour


Oui effectivement
J'ai presque réussi à générer l'index alphabétique que je souhaitais
J'ai juste un petit problème

Pour bien comprendre je reprends l'ensemble du problème
un document sous word 2007 comporte 145 pages
dont voici un court extrait :

381 Agnès NOLHAC ° 1633
+ 28/11/1708 Soucieu-en-Jarrest (69)
382 Benoît GRANJON ° ca 1645
+ 26/07/1684 Soucieu-en-Jarrest (69)
383 x 18/12/1667 Lyon (69)

les numéros, les prénoms et noms sont en caractères arial gras
Il s'agit de réaliser un index alphabétique
J'ai appliqué la méthode préconisée :


1- Rechercher les mots gras et italique (par exemple), et en activant
l'option Surligner tous les éléments trouvés
2- Copier tous les mots trouvés dans un autre document pour en faire un
fichier de concordance
3- Exécuter l'indexation grâce au fichier de concordance grâce au bouton
Marquage auto de la boite de dialogue Index
4- Générer l'index


Quand je fais l'opération 2 "copier" je fais d'abord "sélectionner le
texte ayant une mise en forme semblable"
et j'obtiens :

Agnès NOLHAC
Benoît GRANJON

et à la fin j'ai bien un index alphabétique sur les prénoms
C'est un index alphabétique sur les noms que je voudrai

dans l'opération 1 je n'arrive pas à obtenir seulement les mots en
majuscule.

Sinon la solution préconisée est vraiment géniale
à+

Francis Gros










Thierry Fontenelle [MSFT]
Le #6427341
Bonjour,

La recherche de caractères peut se faire sur les mots entiers. Tout le
problème est que la notion de « mot » est difficilement définissable.
Qu’est-ce qu’un mot ? Dans « l’UNESCO », on a probablement deux mots (l’ +
UNESCO) et l’apostrophe est ici un caractère séparable (mais elle ne l’est
pas toujours : dans aujourd’hui, il n’y a qu’un mot et on ne considère pas
aujourd’ comme un mot distinct).
Dans l’expression régulière que donne Dom dans son autre réponse, si on
utilise le < pour signaler qu’on veut des majuscules au début de la chaine de
caractères, on ne repère justement pas l’UNESCO, l’ONU, d’ESB, etc… D’où ma
suggestion de ne pas utiliser le <.

A propos, pour le séparateur de liste, Dom a raison : c’est le point virgule
pour la version française. Quand je l’ai essayé sur ma machine, ça ne marche
pas parce que j’utilisais une version anglaise, où le séparateur pour les USA
est la virgule : donc, pour moi, je dois utiliser [A-Z]{2,} alors que pour
vous, qui êtes en France, vous devez utiliser [A-Z]{2;}.

Pour Dom, je précise que l’expression que tu préconises :
<[A-Z;';-]{2;}
repère aussi des mots dont seule la première lettre est en majuscule et où
l’utilisateur a utilisé une apostrophe comme guillemet (par exemple comme
dans une citation bibliographique : ‘Computer-related… blabla’ ou ‘C
correspond au patron. Cette expression repère aussi un article élidé en
majuscule suivi d’une apostrophe, comme L’étudiant ou J’ai, en début de
phrase, alors que l’on souhaite surtout avoir tous les mots entièrement en
majuscules. Il y a donc du bruit (on repère trop) et du silence (on ne repère
pas assez, puisqu’on ne repère pas une chaine comme l’ONU).

Comme on le voit, ce problème des apostrophes et des traits d’union empêche
de déterminer facilement ce qu’est un mot (un ‘token’, diraient les
linguistes-informaticiens). C’est aussi ce qui explique qu’il est préférable
de laisser à l’utilisateur définir lui-même ce qu’il recherche. Une
heuristique pour le français ne marchera pas pour l’anglais ou l’allemand.

Pour ceux que ça intéresse, voici un billet (en anglais) que j’avais écrit
sur la difficulté de définir le « mot » avec ces caractères comme les
apostrophes ou les traits d’union qui n’ont pas le même statut dans tous les
contextes
http://blogs.msdn.com/correcteurorthographiqueoffice/archive/2005/12/07/identifying-tokens-is-word-breaking-so-easy.aspx

Passionnant, n'est-il pas? ;-)

Bonne soirée,

Thierry

Thierry Fontenelle [MSFT]
Microsoft Natural Language Group


"Circé" wrote:

Hello Thierry ;)

Bonjour,

Dans ma version, je dois utiliser la virgule et pas le point-virgule pour
indiquer le nombre d’occurrences du patron. J’utiliserais donc :
[A-Z]{2,}
pour repérer les chaines de minimum 2 lettres en majuscules. Vu la fréquence
élevée des apostrophes et articles élidés en français, je conseillerais
probablement de ne pas utiliser le signe < devant l’expression régulière, ce
qui permettra de repérer des mots en majuscules précédés de l’ ou d’, comme
dans l’UNESCO ou l’ONU.


Je découvre seulement ton post ! Tu as raison, j'ai sauté sur mon
clavier trop vite !!! ;))

Exagone69 qui a posé la question n'a pas l'air plus intéressé que ça
par la réponse... ;) je précise néanmoins pour ceux que ça intéresse
que le signe < indique le début d'un mot et que le signe > indique la
fin d'un mot... Au milieu on peut avoir n'importe quoi... Donc
effectivement l'idée de préciser le nombre minimum de caractères en
majuscules est la bonne.

Il est dommage que la recherche avec les caractères génériques ne
puisse pas se faire sur des mots entiers... Crois-tu qu'il soit
envisageable de penser à ça ?

Bon dimanche,


Euh... bon lundi à toi !!! ;)))

Circé



Thierry
Thierry Fontenelle [MSFT]





Bonjour

Pour établir un index alphabétique j'ai besoin de rechercher tous les
mots de mon document (sous Word 2007) qui sont en majuscule

Merci de m'aider


Regardez la conversation "extraction mots" du 3 avril.
Ça devrait vous donner des orientations.

Bonjour


Oui effectivement
J'ai presque réussi à générer l'index alphabétique que je souhaitais
J'ai juste un petit problème

Pour bien comprendre je reprends l'ensemble du problème
un document sous word 2007 comporte 145 pages
dont voici un court extrait :

381 Agnès NOLHAC ° 1633
+ 28/11/1708 Soucieu-en-Jarrest (69)
382 Benoît GRANJON ° ca 1645
+ 26/07/1684 Soucieu-en-Jarrest (69)
383 x 18/12/1667 Lyon (69)

les numéros, les prénoms et noms sont en caractères arial gras
Il s'agit de réaliser un index alphabétique
J'ai appliqué la méthode préconisée :


1- Rechercher les mots gras et italique (par exemple), et en activant
l'option Surligner tous les éléments trouvés
2- Copier tous les mots trouvés dans un autre document pour en faire un
fichier de concordance
3- Exécuter l'indexation grâce au fichier de concordance grâce au bouton
Marquage auto de la boite de dialogue Index
4- Générer l'index


Quand je fais l'opération 2 "copier" je fais d'abord "sélectionner le
texte ayant une mise en forme semblable"
et j'obtiens :

Agnès NOLHAC
Benoît GRANJON

et à la fin j'ai bien un index alphabétique sur les prénoms
C'est un index alphabétique sur les noms que je voudrai

dans l'opération 1 je n'arrive pas à obtenir seulement les mots en
majuscule.

Sinon la solution préconisée est vraiment géniale
à+

Francis Gros















Publicité
Poster une réponse
Anonyme