Modification de fichiers texte et gestion des caractères spéciaux avec sed, awk, perl

Marc Chantreux

21/07/2006 à 11:50

Bonjour,

le 21/07/2006,
Eric Veiras Galisson nous écrivait :

salut

et que ni sed, ni awk ni perl ne semble apprécier (par défaut... ) les /,

tu peux utiliser un autre symbole pour delimiter tes motifs :

perl -lpe 's#pattern1#pattern2#'
perl -lne 'm{pattern} and print '

--
téléphone : 03.90.24.00.19
courriel :
---------------------------------------

Eric Veiras Galisson

21/07/2006 à 12:30

------=_Part_17858_24651646.1153476696797
Content-Type: text/plain; charset=ISO-8859-1; format=flowed
Content-Transfer-Encoding: quoted-printable
Content-Disposition: inline

On 7/21/06, Marc Chantreux wrote:

Bonjour,

le 21/07/2006,
Eric Veiras Galisson nous écrivait :

salut

> et que ni sed, ni awk ni perl ne semble apprécier (par défaut... ) les
/,

tu peux utiliser un autre symbole pour delimiter tes motifs :

perl -lpe 's#pattern1#pattern2#'
perl -lne 'm{pattern} and print '

c'est déjà ce que j'ai fait, à la fois pour sed, awk et perl en utili sant !
au lien de / comme délimiteur (et non pas caractère de séparation com me je
l'ai écrit plus haut)

--
Eric Veiras Galisson

------=_Part_17858_24651646.1153476696797
Content-Type: text/html; charset=ISO-8859-1
Content-Transfer-Encoding: quoted-printable
Content-Disposition: inline

 <div>On 7/21/06, Marc Chantreux <<a href="mailto: asbg.fr"></a>> wrote:<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Bonjour, le 21/07/2006, Eric Veiras Galisson nous écrivait : salut >    et que ni sed, ni awk ni perl ne semble apprécier (par défaut...) les /, tu peux utiliser un autre symbole pour delimiter tes motifs :
 perl -lpe 's#pattern1#pattern2#' perl -lne 'm{pattern} and print '</blockquote><div> 
 
c'est déjà ce que j'ai fait, à la fois pour sed, awk et perl en
utilisant ! au lien de / comme délimiteur (et non pas caractère de
séparation comme je l'ai écrit plus haut) 
</div></div> -- Eric Veiras Galisson

------=_Part_17858_24651646.1153476696797--

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact

------=_Part_17858_24651646.1153476696797
Content-Type: text/plain; charset=ISO-8859-1; format=flowed
Content-Transfer-Encoding: quoted-printable
Content-Disposition: inline

On 7/21/06, Marc Chantreux <marc.chantreux@ulpmm.u-strasbg.fr> wrote:

Bonjour,

le 21/07/2006,
Eric Veiras Galisson nous écrivait :

salut

> et que ni sed, ni awk ni perl ne semble apprécier (par défaut... ) les
/,

tu peux utiliser un autre symbole pour delimiter tes motifs :

perl -lpe 's#pattern1#pattern2#'
perl -lne 'm{pattern} and print '

c'est déjà ce que j'ai fait, à la fois pour sed, awk et perl en utili sant !
au lien de / comme délimiteur (et non pas caractère de séparation com me je
l'ai écrit plus haut)

--
Eric Veiras Galisson

------=_Part_17858_24651646.1153476696797
Content-Type: text/html; charset=ISO-8859-1
Content-Transfer-Encoding: quoted-printable
Content-Disposition: inline

 <div>On 7/21/06, Marc Chantreux <<a href="mailto:marc.chantreux@ulpmm.u-str asbg.fr">marc.chantreux@ulpmm.u-strasbg.fr</a>> wrote:<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Bonjour, le 21/07/2006, Eric Veiras Galisson nous écrivait : salut >    et que ni sed, ni awk ni perl ne semble apprécier (par défaut...) les /, tu peux utiliser un autre symbole pour delimiter tes motifs :
 perl -lpe 's#pattern1#pattern2#' perl -lne 'm{pattern} and print '</blockquote><div> 
 
c'est déjà ce que j'ai fait, à la fois pour sed, awk et perl en
utilisant ! au lien de / comme délimiteur (et non pas caractère de
séparation comme je l'ai écrit plus haut) 
</div></div> -- Eric Veiras Galisson

------=_Part_17858_24651646.1153476696797--

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to debian-user-french-REQUEST@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org

Vous avez filtré cet utilisateur ! Consultez son message

------=_Part_17858_24651646.1153476696797
Content-Type: text/plain; charset=ISO-8859-1; format=flowed
Content-Transfer-Encoding: quoted-printable
Content-Disposition: inline

On 7/21/06, Marc Chantreux wrote:

Bonjour,

le 21/07/2006,
Eric Veiras Galisson nous écrivait :

salut

> et que ni sed, ni awk ni perl ne semble apprécier (par défaut... ) les
/,

tu peux utiliser un autre symbole pour delimiter tes motifs :

perl -lpe 's#pattern1#pattern2#'
perl -lne 'm{pattern} and print '

c'est déjà ce que j'ai fait, à la fois pour sed, awk et perl en utili sant !
au lien de / comme délimiteur (et non pas caractère de séparation com me je
l'ai écrit plus haut)

--
Eric Veiras Galisson

------=_Part_17858_24651646.1153476696797
Content-Type: text/html; charset=ISO-8859-1
Content-Transfer-Encoding: quoted-printable
Content-Disposition: inline

 <div>On 7/21/06, Marc Chantreux <<a href="mailto: asbg.fr"></a>> wrote:<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Bonjour, le 21/07/2006, Eric Veiras Galisson nous écrivait : salut >    et que ni sed, ni awk ni perl ne semble apprécier (par défaut...) les /, tu peux utiliser un autre symbole pour delimiter tes motifs :
 perl -lpe 's#pattern1#pattern2#' perl -lne 'm{pattern} and print '</blockquote><div> 
 
c'est déjà ce que j'ai fait, à la fois pour sed, awk et perl en
utilisant ! au lien de / comme délimiteur (et non pas caractère de
séparation comme je l'ai écrit plus haut) 
</div></div> -- Eric Veiras Galisson

------=_Part_17858_24651646.1153476696797--

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact

Marc Chantreux

21/07/2006 à 14:00

le 21/07/2006,
Eric Veiras Galisson nous écrivait :

c'est déjà ce que j'ai fait, à la fois pour sed, awk et perl e n utilisant
! au lien de / comme délimiteur (et non pas caractère de sépar ation comme
je l'ai écrit plus haut)

pourrais tu nous donner un cas concret avec une source, une commande et
un message d'erreur. Nous aurions moins de difficulté a cerner ton
problème.

--
téléphone : 03.90.24.00.19
courriel :
---------------------------------------

Eric Veiras Galisson

21/07/2006 à 16:00

On 7/21/06, Marc Chantreux wrote:

le 21/07/2006,
Eric Veiras Galisson nous écrivait :
> c'est déjà ce que j'ai fait, à la fois pour sed, awk et perl e n utilisant
> ! au lien de / comme délimiteur (et non pas caractère de sépar ation comme
> je l'ai écrit plus haut)

pourrais tu nous donner un cas concret avec une source, une commande et
un message d'erreur. Nous aurions moins de difficulté a cerner ton
problème.

En effet, j'aurais au moins pu donner le message d'erreur... désolé.

Voilà.

J'ai un fichier html comme celui-ci (je l'ai simplifié) :
<tr>
<td class="sstitre"><div align="left">
<a
href="http://mon.domaine.tld/informatique/accueil.html"
class=lienTitre>Accueil</a> 
<a
href="http://mon.domaine.tld/informatique/contact.html"
class=lienTitre>Coordonnées</a> 
<a
href="http://mon.domaine.tld/informatique/securite.html"
class=lienTitre>Sécurité</a> 
<a
href="http://mon.domaine.tld/informatique/services.html"
class=lienTitre>Services</a> 
</div>
</td>
</tr>

et je veux insérer derrière la ligne "Services" un autre lien vers un W iki

si je lance avec awk cette commande :

$ awk '#<a href="http://mon.domaine.tld/informatique/services.html"
class=lienTitre>Services</a># {print $1"n<a
href="http://wiki.domaine.tld/wiki" class=lienTitre>Wiki</a>"}'
fichier.html

je n'ai aucun message d'erreur mais aucune modification non plus de mon fic hier

(j'ai suivi ton conseil et remplacé mon ! par #, parce qu'avec le !
j'avais des messages d'erreur... ce n'était pas une bonne idée
d'utiliser ce symbole...)

Avec sed
$ sed -ei '#<a href="http://mon.domaine.tld/informatique/services.html"
class=lienTitre>Services</a># a<a href="http://wiki.domaine.tld/wiki"
class=lienTitre>Wiki</a>' fichier.html

J'ai le message

sed: -e expression n°1, caractère 1: attendu après `a', `c' ou `i'

surement dû au '<' juste après.

Par contre, si j'utilise perl

$ perl -pi.bak -e 's#(<a
href="http://mon.domaine.tld/informatique/services.html"
class=lienTitre>Services</a>)#$1 n<a
href="http://wiki.domaine.tld/wiki" class=lienTitre>Wiki</a>#g'
test.html

là, ça marche bien, donc mon problème est résolu, mais j'aurais
néanmoins aimé pouvoir le faire avec sed et awk.

--
Eric Veiras Galisson

On 7/21/06, Marc Chantreux <marc.chantreux@ulpmm.u-strasbg.fr> wrote:

le 21/07/2006,
Eric Veiras Galisson nous écrivait :
> c'est déjà ce que j'ai fait, à la fois pour sed, awk et perl e n utilisant
> ! au lien de / comme délimiteur (et non pas caractère de sépar ation comme
> je l'ai écrit plus haut)

pourrais tu nous donner un cas concret avec une source, une commande et
un message d'erreur. Nous aurions moins de difficulté a cerner ton
problème.

En effet, j'aurais au moins pu donner le message d'erreur... désolé.

Voilà.

J'ai un fichier html comme celui-ci (je l'ai simplifié) :
<tr>
<td class="sstitre"><div align="left">
<a
href="http://mon.domaine.tld/informatique/accueil.html"
class=lienTitre>Accueil</a> 
<a
href="http://mon.domaine.tld/informatique/contact.html"
class=lienTitre>Coordonnées</a> 
<a
href="http://mon.domaine.tld/informatique/securite.html"
class=lienTitre>Sécurité</a> 
<a
href="http://mon.domaine.tld/informatique/services.html"
class=lienTitre>Services</a> 
</div>
</td>
</tr>

et je veux insérer derrière la ligne "Services" un autre lien vers un W iki

si je lance avec awk cette commande :

$ awk '#<a href="http://mon.domaine.tld/informatique/services.html"
class=lienTitre>Services</a># {print $1"n<a
href="http://wiki.domaine.tld/wiki" class=lienTitre>Wiki</a>"}'
fichier.html

je n'ai aucun message d'erreur mais aucune modification non plus de mon fic hier

(j'ai suivi ton conseil et remplacé mon ! par #, parce qu'avec le !
j'avais des messages d'erreur... ce n'était pas une bonne idée
d'utiliser ce symbole...)

Avec sed
$ sed -ei '#<a href="http://mon.domaine.tld/informatique/services.html"
class=lienTitre>Services</a># a<a href="http://wiki.domaine.tld/wiki"
class=lienTitre>Wiki</a>' fichier.html

J'ai le message

sed: -e expression n°1, caractère 1: attendu après `a', `c' ou `i'

surement dû au '<' juste après.

Par contre, si j'utilise perl

$ perl -pi.bak -e 's#(<a
href="http://mon.domaine.tld/informatique/services.html"
class=lienTitre>Services</a>)#$1 n<a
href="http://wiki.domaine.tld/wiki" class=lienTitre>Wiki</a>#g'
test.html

là, ça marche bien, donc mon problème est résolu, mais j'aurais
néanmoins aimé pouvoir le faire avec sed et awk.

--
Eric Veiras Galisson

Vous avez filtré cet utilisateur ! Consultez son message

On 7/21/06, Marc Chantreux wrote:

le 21/07/2006,
Eric Veiras Galisson nous écrivait :
> c'est déjà ce que j'ai fait, à la fois pour sed, awk et perl e n utilisant
> ! au lien de / comme délimiteur (et non pas caractère de sépar ation comme
> je l'ai écrit plus haut)

pourrais tu nous donner un cas concret avec une source, une commande et
un message d'erreur. Nous aurions moins de difficulté a cerner ton
problème.

En effet, j'aurais au moins pu donner le message d'erreur... désolé.

Voilà.

J'ai un fichier html comme celui-ci (je l'ai simplifié) :
<tr>
<td class="sstitre"><div align="left">
<a
href="http://mon.domaine.tld/informatique/accueil.html"
class=lienTitre>Accueil</a> 
<a
href="http://mon.domaine.tld/informatique/contact.html"
class=lienTitre>Coordonnées</a> 
<a
href="http://mon.domaine.tld/informatique/securite.html"
class=lienTitre>Sécurité</a> 
<a
href="http://mon.domaine.tld/informatique/services.html"
class=lienTitre>Services</a> 
</div>
</td>
</tr>

et je veux insérer derrière la ligne "Services" un autre lien vers un W iki

si je lance avec awk cette commande :

$ awk '#<a href="http://mon.domaine.tld/informatique/services.html"
class=lienTitre>Services</a># {print $1"n<a
href="http://wiki.domaine.tld/wiki" class=lienTitre>Wiki</a>"}'
fichier.html

je n'ai aucun message d'erreur mais aucune modification non plus de mon fic hier

(j'ai suivi ton conseil et remplacé mon ! par #, parce qu'avec le !
j'avais des messages d'erreur... ce n'était pas une bonne idée
d'utiliser ce symbole...)

Avec sed
$ sed -ei '#<a href="http://mon.domaine.tld/informatique/services.html"
class=lienTitre>Services</a># a<a href="http://wiki.domaine.tld/wiki"
class=lienTitre>Wiki</a>' fichier.html

J'ai le message

sed: -e expression n°1, caractère 1: attendu après `a', `c' ou `i'

surement dû au '<' juste après.

Par contre, si j'utilise perl

$ perl -pi.bak -e 's#(<a
href="http://mon.domaine.tld/informatique/services.html"
class=lienTitre>Services</a>)#$1 n<a
href="http://wiki.domaine.tld/wiki" class=lienTitre>Wiki</a>#g'
test.html

là, ça marche bien, donc mon problème est résolu, mais j'aurais
néanmoins aimé pouvoir le faire avec sed et awk.

--
Eric Veiras Galisson

Eric Veiras Galisson

21/07/2006 à 16:10

On 7/21/06, Guy Roussin wrote:

Bonjour,

Peut-être faut-il protéger les caractères spéciaux avec des ?

c'est ce à quoi j'ai en partie pensé, (et ce pourquoi j'ai posté ici)
parce que dans ce cas :
1. avec quel caractère ? est-ce vraiment '' qu'il faut utiliser ?
2. quels caractère faut-il protéger ? '/' ok, mais ':' également ? '< ' ? '>' ?
3. n'y a-t-il pas un moyen de lui dire de ne pas "évaluer" ses
caractère spéciaux ?

(pour awk et sed)

--
Eric Veiras Galisson

Sylvain Sauvage

21/07/2006 à 19:30

Vendredi 21 juillet 2006, 15:40:52 CEST, Eric Veiras Galisson a écrit :

[...]
si je lance avec awk cette commande :

$ awk '#<a href="http://mon.domaine.tld/informatique/services.html"
class=lienTitre>Services</a># {print $1"n<a
href="http://wiki.domaine.tld/wiki" class=lienTitre>Wiki</a>"}'
fichier.html

je n'ai aucun message d'erreur mais aucune modification non plus de mon
fichier

awk attend forcément un / pour une regexp, comme tu lui donnes #, il
prend ça pour une expression. Voir le manuel de awk, je m'en sers
rarement avec des expressions complexes.

(j'ai suivi ton conseil et remplacé mon ! par #, parce qu'avec le !
j'avais des messages d'erreur... ce n'était pas une bonne idée
d'utiliser ce symbole...)

Normal, en bash (et autres sh), ! sert pour la gestion d'historiques.
(Et, s'il est « simple-quoté », c'est l'opérateur non.)

Avec sed
$ sed -ei '#<a href="http://mon.domaine.tld/informatique/services.html"
class=lienTitre>Services</a># a<a href="http://wiki.domaine.tld/wiki"
class=lienTitre>Wiki</a>' fichier.html

Sed peut prendre d'autres caractères que / comme marqueur de regexp, si
on suit ces règles :
- après une commande, aucun problème (p.ex. 's:a:b:' est pareil que
's/a/b/) ;
- avant une commande (c'est-à-dire comme adresse), il faut protéger le
premier : '/a/,/b/ s/x/y/' peut devenir ':a:,,b, s!x!y!'

Par contre, si j'utilise perl

$ perl -pi.bak -e 's#(<a
href="http://mon.domaine.tld/informatique/services.html"
class=lienTitre>Services</a>)#$1 n<a
href="http://wiki.domaine.tld/wiki" class=lienTitre>Wiki</a>#g'
test.html

là, ça marche bien, donc mon problème est résolu, mais j'aurais
néanmoins aimé pouvoir le faire avec sed et awk.

Je ne connais pas bien perl mais sans doute est-ce parce que tu places la
regexp après la commande 's' (comme cela fonctionnerait avec sed (sauf
que non à cause du saut ligne)).

--
Sylvain Sauvage

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact

Vendredi 21 juillet 2006, 15:40:52 CEST, Eric Veiras Galisson a écrit :

[...]
si je lance avec awk cette commande :

$ awk '#<a href="http://mon.domaine.tld/informatique/services.html"
class=lienTitre>Services</a># {print $1"n<a
href="http://wiki.domaine.tld/wiki" class=lienTitre>Wiki</a>"}'
fichier.html

je n'ai aucun message d'erreur mais aucune modification non plus de mon
fichier

awk attend forcément un / pour une regexp, comme tu lui donnes #, il
prend ça pour une expression. Voir le manuel de awk, je m'en sers
rarement avec des expressions complexes.

(j'ai suivi ton conseil et remplacé mon ! par #, parce qu'avec le !
j'avais des messages d'erreur... ce n'était pas une bonne idée
d'utiliser ce symbole...)

Normal, en bash (et autres sh), ! sert pour la gestion d'historiques.
(Et, s'il est « simple-quoté », c'est l'opérateur non.)

Avec sed
$ sed -ei '#<a href="http://mon.domaine.tld/informatique/services.html"
class=lienTitre>Services</a># a<a href="http://wiki.domaine.tld/wiki"
class=lienTitre>Wiki</a>' fichier.html

Sed peut prendre d'autres caractères que / comme marqueur de regexp, si
on suit ces règles :
- après une commande, aucun problème (p.ex. 's:a:b:' est pareil que
's/a/b/) ;
- avant une commande (c'est-à-dire comme adresse), il faut protéger le
premier : '/a/,/b/ s/x/y/' peut devenir ':a:,,b, s!x!y!'

Par contre, si j'utilise perl

$ perl -pi.bak -e 's#(<a
href="http://mon.domaine.tld/informatique/services.html"
class=lienTitre>Services</a>)#$1 n<a
href="http://wiki.domaine.tld/wiki" class=lienTitre>Wiki</a>#g'
test.html

là, ça marche bien, donc mon problème est résolu, mais j'aurais
néanmoins aimé pouvoir le faire avec sed et awk.

Je ne connais pas bien perl mais sans doute est-ce parce que tu places la
regexp après la commande 's' (comme cela fonctionnerait avec sed (sauf
que non à cause du saut ligne)).

--
Sylvain Sauvage

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to debian-user-french-REQUEST@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org

Vous avez filtré cet utilisateur ! Consultez son message

Vendredi 21 juillet 2006, 15:40:52 CEST, Eric Veiras Galisson a écrit :

[...]
si je lance avec awk cette commande :

$ awk '#<a href="http://mon.domaine.tld/informatique/services.html"
class=lienTitre>Services</a># {print $1"n<a
href="http://wiki.domaine.tld/wiki" class=lienTitre>Wiki</a>"}'
fichier.html

je n'ai aucun message d'erreur mais aucune modification non plus de mon
fichier

awk attend forcément un / pour une regexp, comme tu lui donnes #, il
prend ça pour une expression. Voir le manuel de awk, je m'en sers
rarement avec des expressions complexes.

(j'ai suivi ton conseil et remplacé mon ! par #, parce qu'avec le !
j'avais des messages d'erreur... ce n'était pas une bonne idée
d'utiliser ce symbole...)

Normal, en bash (et autres sh), ! sert pour la gestion d'historiques.
(Et, s'il est « simple-quoté », c'est l'opérateur non.)

Avec sed
$ sed -ei '#<a href="http://mon.domaine.tld/informatique/services.html"
class=lienTitre>Services</a># a<a href="http://wiki.domaine.tld/wiki"
class=lienTitre>Wiki</a>' fichier.html

Sed peut prendre d'autres caractères que / comme marqueur de regexp, si
on suit ces règles :
- après une commande, aucun problème (p.ex. 's:a:b:' est pareil que
's/a/b/) ;
- avant une commande (c'est-à-dire comme adresse), il faut protéger le
premier : '/a/,/b/ s/x/y/' peut devenir ':a:,,b, s!x!y!'

Par contre, si j'utilise perl

$ perl -pi.bak -e 's#(<a
href="http://mon.domaine.tld/informatique/services.html"
class=lienTitre>Services</a>)#$1 n<a
href="http://wiki.domaine.tld/wiki" class=lienTitre>Wiki</a>#g'
test.html

là, ça marche bien, donc mon problème est résolu, mais j'aurais
néanmoins aimé pouvoir le faire avec sed et awk.

Je ne connais pas bien perl mais sans doute est-ce parce que tu places la
regexp après la commande 's' (comme cela fonctionnerait avec sed (sauf
que non à cause du saut ligne)).

--
Sylvain Sauvage

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact

Eric Veiras Galisson

24/07/2006 à 10:00

Si je comprends bien, avec awk et sed, c'est super difficile de faire
des manips sur des chaines aussi compliquées et vu que je connais un
peu perl et que je l'utilise sur des machines ou il est présent
(debian !), il faut mieux que j'utilise perl ?

Bon, je regarderais dans les manuels avancés de sed et awk voir si je
trouve (et comprends :) comment manipuler des chaines aussi
compliquées.
En attendant je vais utiliser perl, et vous remercie de votre aide.

On 7/21/06, Sylvain Sauvage wrote:

Vendredi 21 juillet 2006, 15:40:52 CEST, Eric Veiras Galisson a écrit :
>[...]
> si je lance avec awk cette commande :
>
> $ awk '#<a href="http://mon.domaine.tld/informatique/services.html"
> class=lienTitre>Services</a># {print $1"n<a
> href="http://wiki.domaine.tld/wiki" class=lienTitre>Wiki</a>"}'
> fichier.html
>
> je n'ai aucun message d'erreur mais aucune modification non plus de mon
> fichier

awk attend forcément un / pour une regexp, comme tu lui donnes #, il
prend ça pour une expression. Voir le manuel de awk, je m'en sers
rarement avec des expressions complexes.

> (j'ai suivi ton conseil et remplacé mon ! par #, parce qu'avec le !
> j'avais des messages d'erreur... ce n'était pas une bonne idée
> d'utiliser ce symbole...)

Normal, en bash (et autres sh), ! sert pour la gestion d'historiques.
(Et, s'il est « simple-quoté », c'est l'opérateur non.)

> Avec sed
> $ sed -ei '#<a href="http://mon.domaine.tld/informatique/services.htm l"
> class=lienTitre>Services</a># a<a href="http://wiki.domaine.tld/wik i"
> class=lienTitre>Wiki</a>' fichier.html

Sed peut prendre d'autres caractères que / comme marqueur de regexp, si
on suit ces règles :
- après une commande, aucun problème (p.ex. 's:a:b:' est pareil que
's/a/b/) ;
- avant une commande (c'est-à-dire comme adresse), il faut protéger l e
premier : '/a/,/b/ s/x/y/' peut devenir ':a:,,b, s!x!y!'

> Par contre, si j'utilise perl
>
> $ perl -pi.bak -e 's#(<a
> href="http://mon.domaine.tld/informatique/services.html"
> class=lienTitre>Services</a>)#$1 n<a
> href="http://wiki.domaine.tld/wiki" class=lienTitre>Wiki</a>#g'
> test.html
>
> là, ça marche bien, donc mon problème est résolu, mais j'aurais
> néanmoins aimé pouvoir le faire avec sed et awk.

Je ne connais pas bien perl mais sans doute est-ce parce que tu places la
regexp après la commande 's' (comme cela fonctionnerait avec sed (sauf
que non à cause du saut ligne)).

--
Sylvain Sauvage

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact .org

--
Eric Veiras Galisson

Si je comprends bien, avec awk et sed, c'est super difficile de faire
des manips sur des chaines aussi compliquées et vu que je connais un
peu perl et que je l'utilise sur des machines ou il est présent
(debian !), il faut mieux que j'utilise perl ?

Bon, je regarderais dans les manuels avancés de sed et awk voir si je
trouve (et comprends :) comment manipuler des chaines aussi
compliquées.
En attendant je vais utiliser perl, et vous remercie de votre aide.

On 7/21/06, Sylvain Sauvage <Sylvain.Sauvage@metanoesis.net> wrote:

Vendredi 21 juillet 2006, 15:40:52 CEST, Eric Veiras Galisson a écrit :
>[...]
> si je lance avec awk cette commande :
>
> $ awk '#<a href="http://mon.domaine.tld/informatique/services.html"
> class=lienTitre>Services</a># {print $1"n<a
> href="http://wiki.domaine.tld/wiki" class=lienTitre>Wiki</a>"}'
> fichier.html
>
> je n'ai aucun message d'erreur mais aucune modification non plus de mon
> fichier

awk attend forcément un / pour une regexp, comme tu lui donnes #, il
prend ça pour une expression. Voir le manuel de awk, je m'en sers
rarement avec des expressions complexes.

> (j'ai suivi ton conseil et remplacé mon ! par #, parce qu'avec le !
> j'avais des messages d'erreur... ce n'était pas une bonne idée
> d'utiliser ce symbole...)

Normal, en bash (et autres sh), ! sert pour la gestion d'historiques.
(Et, s'il est « simple-quoté », c'est l'opérateur non.)

> Avec sed
> $ sed -ei '#<a href="http://mon.domaine.tld/informatique/services.htm l"
> class=lienTitre>Services</a># a<a href="http://wiki.domaine.tld/wik i"
> class=lienTitre>Wiki</a>' fichier.html

Sed peut prendre d'autres caractères que / comme marqueur de regexp, si
on suit ces règles :
- après une commande, aucun problème (p.ex. 's:a:b:' est pareil que
's/a/b/) ;
- avant une commande (c'est-à-dire comme adresse), il faut protéger l e
premier : '/a/,/b/ s/x/y/' peut devenir ':a:,,b, s!x!y!'

> Par contre, si j'utilise perl
>
> $ perl -pi.bak -e 's#(<a
> href="http://mon.domaine.tld/informatique/services.html"
> class=lienTitre>Services</a>)#$1 n<a
> href="http://wiki.domaine.tld/wiki" class=lienTitre>Wiki</a>#g'
> test.html
>
> là, ça marche bien, donc mon problème est résolu, mais j'aurais
> néanmoins aimé pouvoir le faire avec sed et awk.

Je ne connais pas bien perl mais sans doute est-ce parce que tu places la
regexp après la commande 's' (comme cela fonctionnerait avec sed (sauf
que non à cause du saut ligne)).

--
Sylvain Sauvage

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to debian-user-french-REQUEST@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian .org

--
Eric Veiras Galisson

Vous avez filtré cet utilisateur ! Consultez son message

Si je comprends bien, avec awk et sed, c'est super difficile de faire
des manips sur des chaines aussi compliquées et vu que je connais un
peu perl et que je l'utilise sur des machines ou il est présent
(debian !), il faut mieux que j'utilise perl ?

Bon, je regarderais dans les manuels avancés de sed et awk voir si je
trouve (et comprends :) comment manipuler des chaines aussi
compliquées.
En attendant je vais utiliser perl, et vous remercie de votre aide.

On 7/21/06, Sylvain Sauvage wrote:

Vendredi 21 juillet 2006, 15:40:52 CEST, Eric Veiras Galisson a écrit :
>[...]
> si je lance avec awk cette commande :
>
> $ awk '#<a href="http://mon.domaine.tld/informatique/services.html"
> class=lienTitre>Services</a># {print $1"n<a
> href="http://wiki.domaine.tld/wiki" class=lienTitre>Wiki</a>"}'
> fichier.html
>
> je n'ai aucun message d'erreur mais aucune modification non plus de mon
> fichier

awk attend forcément un / pour une regexp, comme tu lui donnes #, il
prend ça pour une expression. Voir le manuel de awk, je m'en sers
rarement avec des expressions complexes.

> (j'ai suivi ton conseil et remplacé mon ! par #, parce qu'avec le !
> j'avais des messages d'erreur... ce n'était pas une bonne idée
> d'utiliser ce symbole...)

Normal, en bash (et autres sh), ! sert pour la gestion d'historiques.
(Et, s'il est « simple-quoté », c'est l'opérateur non.)

> Avec sed
> $ sed -ei '#<a href="http://mon.domaine.tld/informatique/services.htm l"
> class=lienTitre>Services</a># a<a href="http://wiki.domaine.tld/wik i"
> class=lienTitre>Wiki</a>' fichier.html

Sed peut prendre d'autres caractères que / comme marqueur de regexp, si
on suit ces règles :
- après une commande, aucun problème (p.ex. 's:a:b:' est pareil que
's/a/b/) ;
- avant une commande (c'est-à-dire comme adresse), il faut protéger l e
premier : '/a/,/b/ s/x/y/' peut devenir ':a:,,b, s!x!y!'

> Par contre, si j'utilise perl
>
> $ perl -pi.bak -e 's#(<a
> href="http://mon.domaine.tld/informatique/services.html"
> class=lienTitre>Services</a>)#$1 n<a
> href="http://wiki.domaine.tld/wiki" class=lienTitre>Wiki</a>#g'
> test.html
>
> là, ça marche bien, donc mon problème est résolu, mais j'aurais
> néanmoins aimé pouvoir le faire avec sed et awk.

Je ne connais pas bien perl mais sans doute est-ce parce que tu places la
regexp après la commande 's' (comme cela fonctionnerait avec sed (sauf
que non à cause du saut ligne)).

--
Sylvain Sauvage

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact .org

--
Eric Veiras Galisson

Modification de fichiers texte et gestion des caractères spéciaux avec sed, awk, perl

7 réponses

Veuillez sélectionner un problème