J'ai convertis un fichier tableur (LibreOffice Calc) en html pour pouvoir le lire directement avec un navigateur Web.
Ce fichier a dans ses balises des "propriétés" propres à LibreOffice :
sdnum=" [du texte] " sdval=" [une valeur] "
Comment faire avec Emacs pour enlever toutes ces "propriétés" et rendre ainsi le fichier html plus léger ?
Le problème (pour moi) est que le texte ou la valeur indiqués entre guillements ne sont pas toujours les mêmes.
Avec un petit motif de remplacement pour query-replace-regexp ? Sur un petit jeu de données que j'ai simulé ici, un coup de C-M-S-% ou M-x query-replace-regexp RET
motif à rechercher: (sdnum|sdval)=".*" à remplacer par "" (chaine vide)
Si c'est susceptible de trouver du texte il sera mis en surbrillance et Emacs se positionne sur le permier résultat en demandant une confirmation : - "y" pour accepter et passer au suivant - "n" pour refuser et passer au suivant si ça semble ok après 2 ou 3 remplacements, "!" permet d'effectuer tous les remplacements restants en une fois sans confirmation supllémentaire.
HTH, -- Sébastien Kirche
Le 19 octobre 2015 à 14:27, Escargot vraute :
Bonjour,
Bonjour,
J'ai convertis un fichier tableur (LibreOffice Calc) en html pour
pouvoir le lire directement avec un navigateur Web.
Ce fichier a dans ses balises des "propriétés" propres à LibreOffice :
sdnum=" [du texte] "
sdval=" [une valeur] "
Comment faire avec Emacs pour enlever toutes ces "propriétés" et
rendre ainsi le fichier html plus léger ?
Le problème (pour moi) est que le texte ou la valeur indiqués entre
guillements ne sont pas toujours les mêmes.
Avec un petit motif de remplacement pour query-replace-regexp ?
Sur un petit jeu de données que j'ai simulé ici, un coup de C-M-S-% ou
M-x query-replace-regexp RET
motif à rechercher: (sdnum|sdval)=".*"
à remplacer par "" (chaine vide)
Si c'est susceptible de trouver du texte il sera mis en surbrillance et
Emacs se positionne sur le permier résultat en demandant une
confirmation :
- "y" pour accepter et passer au suivant
- "n" pour refuser et passer au suivant
si ça semble ok après 2 ou 3 remplacements, "!" permet d'effectuer tous
les remplacements restants en une fois sans confirmation supllémentaire.
J'ai convertis un fichier tableur (LibreOffice Calc) en html pour pouvoir le lire directement avec un navigateur Web.
Ce fichier a dans ses balises des "propriétés" propres à LibreOffice :
sdnum=" [du texte] " sdval=" [une valeur] "
Comment faire avec Emacs pour enlever toutes ces "propriétés" et rendre ainsi le fichier html plus léger ?
Le problème (pour moi) est que le texte ou la valeur indiqués entre guillements ne sont pas toujours les mêmes.
Avec un petit motif de remplacement pour query-replace-regexp ? Sur un petit jeu de données que j'ai simulé ici, un coup de C-M-S-% ou M-x query-replace-regexp RET
motif à rechercher: (sdnum|sdval)=".*" à remplacer par "" (chaine vide)
Si c'est susceptible de trouver du texte il sera mis en surbrillance et Emacs se positionne sur le permier résultat en demandant une confirmation : - "y" pour accepter et passer au suivant - "n" pour refuser et passer au suivant si ça semble ok après 2 ou 3 remplacements, "!" permet d'effectuer tous les remplacements restants en une fois sans confirmation supllémentaire.
,----[ (info "(emacs)Backslash in Regular Expressions") ] | âbâ | matches the empty string, but only at the beginning or end of a | word. Thus, âbfoobâ matches any occurrence of â fooâ as a | separate word. âbballs?bâ matches âball â or âballsâ as a | separate word. | | âbâ matches at the beginning or end of the buffer r egardless of | what text appears next to it. `----
,----[ (info "(emacs)Backslash in Regular Expressions") ]
| âbâ
| matches the empty string, but only at the beginning or end of a
| word. Thus, âbfoobâ matches any occurrence of â fooâ as a
| separate word. âbballs?bâ matches âball â or âballsâ as a
| separate word.
|
| âbâ matches at the beginning or end of the buffer r egardless of
| what text appears next to it.
`----
,----[ (info "(emacs)Backslash in Regular Expressions") ] | âbâ | matches the empty string, but only at the beginning or end of a | word. Thus, âbfoobâ matches any occurrence of â fooâ as a | separate word. âbballs?bâ matches âball â or âballsâ as a | separate word. | | âbâ matches at the beginning or end of the buffer r egardless of | what text appears next to it. `----
Je dirais s'unifie, mais je pense que tous les utilisateurs des regexps comprennent ce que veut dire match.
-- JJ R.
Benoit Izac
Bonjour,
Le 20/10/2015 à 23:20, Jean-Jacques Rétorré a écrit dans le message :
matche toutes les expressions que tu veux éliminer (chais plus comment on dit en français).
Dire regexp ou match ? Regexp : expression rationnelle, si jeune m'abuse. Match : trouve (pour ta phrase) ? Sinon, correspond à ?
Regexp, ça je sais, mais le sens de match me paraît assez éloigné de trouver
D'après google-translate ,----[ M-x google-translate-at-point ] | verb | 1. égaler (match, equal, equate) | 2. répondre à (answer, fulfill, fit, cater for, match, return) | 3. harmoniser (harmonize, match, attune) | 4. aller bien avec (match) | 5. faire la paire (pair, match) | 6. aller bien ensemble (match, match up) | 7. être bien assorti (match) | 8. être l'égal de (match, be on a par with) | 9. s'assortir (assort, match) | 10. s'harmoniser (harmonize, match, tone, match up) | 11. s'identifier (match) | 12. s'unir (unite, coalesce, match) `----
Je dirais s'unifie, mais je pense que tous les utilisateurs des regexps comprennent ce que veut dire match.
Je pense que c'est plus proche de « correspond à » comme l'avait signalé Lucas, en tout cas ce n'est pas « unifier ».
‘b’ matches the empty string => 'b' correspond à une chaîne vide ‘b’ matches at the beginning or end => 'b' correspond au début ou à la fin
-- Benoit Izac
Bonjour,
Le 20/10/2015 à 23:20, Jean-Jacques Rétorré a écrit dans le message
<878u6xkzjc.fsf@none.nowhere.com> :
matche toutes les expressions
que tu veux éliminer (chais plus comment on dit en français).
Dire regexp ou match ? Regexp : expression rationnelle, si jeune
m'abuse. Match : trouve (pour ta phrase) ? Sinon, correspond à ?
Regexp, ça je sais, mais le sens de match me paraît assez éloigné de
trouver
D'après google-translate
,----[ M-x google-translate-at-point ]
| verb
| 1. égaler (match, equal, equate)
| 2. répondre à (answer, fulfill, fit, cater for, match, return)
| 3. harmoniser (harmonize, match, attune)
| 4. aller bien avec (match)
| 5. faire la paire (pair, match)
| 6. aller bien ensemble (match, match up)
| 7. être bien assorti (match)
| 8. être l'égal de (match, be on a par with)
| 9. s'assortir (assort, match)
| 10. s'harmoniser (harmonize, match, tone, match up)
| 11. s'identifier (match)
| 12. s'unir (unite, coalesce, match)
`----
Je dirais s'unifie, mais je pense que tous les utilisateurs des regexps
comprennent ce que veut dire match.
Je pense que c'est plus proche de « correspond à » comme l'avait signalé
Lucas, en tout cas ce n'est pas « unifier ».
‘b’ matches the empty string => 'b' correspond à une chaîne vide
‘b’ matches at the beginning or end => 'b' correspond au début ou à la fin
Le 20/10/2015 à 23:20, Jean-Jacques Rétorré a écrit dans le message :
matche toutes les expressions que tu veux éliminer (chais plus comment on dit en français).
Dire regexp ou match ? Regexp : expression rationnelle, si jeune m'abuse. Match : trouve (pour ta phrase) ? Sinon, correspond à ?
Regexp, ça je sais, mais le sens de match me paraît assez éloigné de trouver
D'après google-translate ,----[ M-x google-translate-at-point ] | verb | 1. égaler (match, equal, equate) | 2. répondre à (answer, fulfill, fit, cater for, match, return) | 3. harmoniser (harmonize, match, attune) | 4. aller bien avec (match) | 5. faire la paire (pair, match) | 6. aller bien ensemble (match, match up) | 7. être bien assorti (match) | 8. être l'égal de (match, be on a par with) | 9. s'assortir (assort, match) | 10. s'harmoniser (harmonize, match, tone, match up) | 11. s'identifier (match) | 12. s'unir (unite, coalesce, match) `----
Je dirais s'unifie, mais je pense que tous les utilisateurs des regexps comprennent ce que veut dire match.
Je pense que c'est plus proche de « correspond à » comme l'avait signalé Lucas, en tout cas ce n'est pas « unifier ».
‘b’ matches the empty string => 'b' correspond à une chaîne vide ‘b’ matches at the beginning or end => 'b' correspond au début ou à la fin
-- Benoit Izac
Lucas Levrel
Le 20 octobre 2015, Jean-Jacques Rétorré a écrit :
mar. 20 oct. 2015, Lucas Levrel nous disait que :
Le 19 octobre 2015, Jean-Jacques Rétorré a écrit :
La regerxp :
b(sdnum|sdval)="[^"]*"
Que signifie le b ?
,----[ (info "(emacs)Backslash in Regular Expressions") ] | ‘b’ | matches the empty string, but only at the beginning or end of a | word. Thus, ‘bfoob’ matches any occurrence of ‘foo’ as a | separate word. ‘bballs?b’ matches ‘ball’ or ‘balls’ as a | separate word. | | ‘b’ matches at the beginning or end of the buffer regardless of | what text appears next to it. `----
Merci. Question subsidiaire : comment obtient-on cette entrée d'info ?
-- LL Ἕν οἶδα ὅτι οὐδὲν οἶδα (Σωκράτης)
Le 20 octobre 2015, Jean-Jacques Rétorré a écrit :
mar. 20 oct. 2015, Lucas Levrel <lucas.levrel@u-pec.fr> nous disait que :
Le 19 octobre 2015, Jean-Jacques Rétorré a écrit :
La regerxp :
b(sdnum|sdval)="[^"]*"
Que signifie le b ?
,----[ (info "(emacs)Backslash in Regular Expressions") ]
| ‘b’
| matches the empty string, but only at the beginning or end of a
| word. Thus, ‘bfoob’ matches any occurrence of ‘foo’ as a
| separate word. ‘bballs?b’ matches ‘ball’ or ‘balls’ as a
| separate word.
|
| ‘b’ matches at the beginning or end of the buffer regardless of
| what text appears next to it.
`----
Merci. Question subsidiaire : comment obtient-on cette entrée d'info ?
Le 20 octobre 2015, Jean-Jacques Rétorré a écrit :
mar. 20 oct. 2015, Lucas Levrel nous disait que :
Le 19 octobre 2015, Jean-Jacques Rétorré a écrit :
La regerxp :
b(sdnum|sdval)="[^"]*"
Que signifie le b ?
,----[ (info "(emacs)Backslash in Regular Expressions") ] | ‘b’ | matches the empty string, but only at the beginning or end of a | word. Thus, ‘bfoob’ matches any occurrence of ‘foo’ as a | separate word. ‘bballs?b’ matches ‘ball’ or ‘balls’ as a | separate word. | | ‘b’ matches at the beginning or end of the buffer regardless of | what text appears next to it. `----
Merci. Question subsidiaire : comment obtient-on cette entrée d'info ?
-- LL Ἕν οἶδα ὅτι οὐδὲν οἶδα (Σωκράτης)
Sébastien Kirche
Le 21 octobre 2015 ¨¤ 20:54, Lucas Levrel a tapot¨¦ :
> > Que signifie le b ? > > ,----[ (info "(emacs)Backslash in Regular Expressions") ] > > ¡®b¡¯ > > matches the empty string, but only at the beginning or end of a > > word. Thus, ¡®bfoob¡¯ matches any occurrence of ¡®foo ¡¯ as a > > separate word. ¡®bballs?b¡¯ matches ¡®ball¡¯ or ¡®balls¡¯ as a > > separate word. > > > > ¡®b¡¯ matches at the beginning or end of the buffer regardle ss of > > what text appears next to it. > `----
Merci. Question subsidiaire : comment obtient-on cette entr¨¦e d'info ?
Je dirais : - C-h i pour aller dans Info - m emacs RET pour ouvrir la partie de la doc d'Emacs - s backslash RET pour rechercher le noeud ou m regexp backslash RET si on connait d¨¦j¨¤ la section recher ch¨¦e -- S¨¦bastien Kirche
Le 21 octobre 2015 ¨¤ 20:54, Lucas Levrel a tapot¨¦ :
> > Que signifie le b ?
>
> ,----[ (info "(emacs)Backslash in Regular Expressions") ]
> > ¡®b¡¯
> > matches the empty string, but only at the beginning or end of a
> > word. Thus, ¡®bfoob¡¯ matches any occurrence of ¡®foo ¡¯ as a
> > separate word. ¡®bballs?b¡¯ matches ¡®ball¡¯ or ¡®balls¡¯ as a
> > separate word.
> >
> > ¡®b¡¯ matches at the beginning or end of the buffer regardle ss of
> > what text appears next to it.
> `----
Merci. Question subsidiaire : comment obtient-on cette entr¨¦e d'info ?
Je dirais :
- C-h i pour aller dans Info
- m emacs RET pour ouvrir la partie de la doc d'Emacs
- s backslash RET pour rechercher le noeud
ou m regexp backslash RET si on connait d¨¦j¨¤ la section recher ch¨¦e
--
S¨¦bastien Kirche
Le 21 octobre 2015 ¨¤ 20:54, Lucas Levrel a tapot¨¦ :
> > Que signifie le b ? > > ,----[ (info "(emacs)Backslash in Regular Expressions") ] > > ¡®b¡¯ > > matches the empty string, but only at the beginning or end of a > > word. Thus, ¡®bfoob¡¯ matches any occurrence of ¡®foo ¡¯ as a > > separate word. ¡®bballs?b¡¯ matches ¡®ball¡¯ or ¡®balls¡¯ as a > > separate word. > > > > ¡®b¡¯ matches at the beginning or end of the buffer regardle ss of > > what text appears next to it. > `----
Merci. Question subsidiaire : comment obtient-on cette entr¨¦e d'info ?
Je dirais : - C-h i pour aller dans Info - m emacs RET pour ouvrir la partie de la doc d'Emacs - s backslash RET pour rechercher le noeud ou m regexp backslash RET si on connait d¨¦j¨¤ la section recher ch¨¦e -- S¨¦bastien Kirche
,----[ (info "(emacs)Backslash in Regular Expressions") ] | âbâ | matches the empty string, but only at the beginning or end of a | word. Thus, âbfoobâ matches any occurrence of âfooâ as a | separate word. âbballs?bâ matches âbal lâ or âballsâ as a | separate word. | | âbâ matches at the beginning or end of the buffe r regardless of | what text appears next to it. `----
,----[ (info "(emacs)Backslash in Regular Expressions") ]
| âbâ
| matches the empty string, but only at the beginning or end of a
| word. Thus, âbfoobâ matches any occurrence of âfooâ as a
| separate word. âbballs?bâ matches âbal lâ or âballsâ as a
| separate word.
|
| âbâ matches at the beginning or end of the buffe r regardless of
| what text appears next to it.
`----
,----[ (info "(emacs)Backslash in Regular Expressions") ] | âbâ | matches the empty string, but only at the beginning or end of a | word. Thus, âbfoobâ matches any occurrence of âfooâ as a | separate word. âbballs?bâ matches âbal lâ or âballsâ as a | separate word. | | âbâ matches at the beginning or end of the buffe r regardless of | what text appears next to it. `----