OVH Cloud OVH Cloud

Texte avec des backspaces

9 réponses
Avatar
Le Gaulois
Bonsoir,

Dans les docs Unix il est fréquent qu'on rencontre des fichiers textes
dans lesquels il y a des caractères gras ou soulignés au moyen de
séquences utilisants les backspaces par exemple

_ Backspace A pour A souligné
A Backspace A pour A gras

Si on consulte ça avec un outils destiné à afficher du texte brut,
c'est très pénible à lire. Avec "less" on peut afficher ça
correctement ... sauf s'il y a des lettres accentuées, car
elles sont affichées <81> ...

Quel est le bon moyen pour consulter ces fichiers qui contiennent
ces séquences de backspace et des lettres accentués.

9 réponses

Avatar
Thomas Nemeth
Le ven 24 oct 2003 à 00:12, Le Gaulois a tapoté :
| Bonsoir,

Bonjour,


[...]
| Quel est le bon moyen pour consulter ces fichiers qui contiennent
| ces séquences de backspace et des lettres accentués.

En utilisant less sachant qu'on lui a dit qu'il fallait utiliser
l'alphabet latin1 -- en lisant sa page man.


Thomas
--
Signature aléatoire :
Ta mère elle met des anti-biotiques dans son UC.
Avatar
Stephane Chazelas
2003/10/24, 06:42(+00), Thomas Nemeth:
[...]
| Quel est le bon moyen pour consulter ces fichiers qui contiennent
| ces séquences de backspace et des lettres accentués.

En utilisant less sachant qu'on lui a dit qu'il fallait utiliser
l'alphabet latin1 -- en lisant sa page man.


Voir aussi more (plus standard), most (plus rapide, fluide et
meilleur affichage, mais pas de recherche par regexp), w3m qui
fait aussi browser web (qui fait aussi des recherches par
regexp, mais l'ennui, c'est qu'il n'affiche pas au fur et à
mesure).

Sinon, pour les enlever, utiliser "col -b".

--
Stéphane ["Stephane.Chazelas" arobase "free.fr"]

Avatar
Laurent Wacrenier
Le Gaulois écrit:
Bonsoir,

Dans les docs Unix il est fréquent qu'on rencontre des fichiers textes
dans lesquels il y a des caractères gras ou soulignés au moyen de
séquences utilisants les backspaces par exemple

_ Backspace A pour A souligné
A Backspace A pour A gras

Si on consulte ça avec un outils destiné à afficher du texte brut,
c'est très pénible à lire. Avec "less" on peut afficher ça
correctement ... sauf s'il y a des lettres accentuées, car
elles sont affichées <81> ...


<81> n'est pas une lettre accentuée mais un caractère de controle
ISO8858-1. Ça n'a rien à faire dans un fichier texte.

Avatar
Stephane Chazelas
2003/10/24, 10:48(+00), Laurent Wacrenier:
[...]
<81> n'est pas une lettre accentuée mais un caractère de controle
ISO8858-1. Ça n'a rien à faire dans un fichier texte.


Oui, mais si le fichier est écrit dans le charset DOS cp850,
c'est un ü (ISO8859-1 0xFC).

Si le charset local est compatible, on peut utiliser "less -r".
Sinon, il faut d'abord convertir le fichier dans le charset
local (voir iconv ou recode)

Ça peut etre aussi de l'UTF-8, par exemple:
Á (ISO8859-1 0xC1) est 0xC3 0x81 en UTF-8.

Dans ce cas, si le charset local est utf-8:
LESSCHARSET=utf-8 less le-fichier

Comme il y a de grandes chances que le charset local soit
ISO8859-1 ou ISO8859-15, il y a des chances qu'il faille
convertir le fichier avant de l'afficher:

iconv -f UTF-8 -t ISO8859-1 < fichier | less
si le fichier est en UTF-8

ou
iconv -f CP850 -t ISO8859-1 < fichier | less
si c'est un fichier DOS.

--
Stéphane ["Stephane.Chazelas" arobase "free.fr"]

Avatar
Daniel Déchelotte
Bonjour,


| Dans les docs Unix il est fréquent qu'on rencontre des fichiers textes
| dans lesquels il y a des caractères gras ou soulignés au moyen de
| séquences utilisants les backspaces par exemple
|
| _ Backspace A pour A souligné
| A Backspace A pour A gras

Par pure curiosite : comment faire exactement pour obtenir cette "mise en
forme" ? J'ai tente un bete echo "blabla_AboboAAbibi" > test ; less test
sans succes (enfin si, less m'affiche le texte). A tout hasard, j'ai
essaye less -r, mais decidemment non.

C'est juste pour essayer et faire "Ooh", c'est tout. :)

Daniel
--
http://yo.dan.free.fr/
Avatar
Stephane Chazelas
2003/10/24, 13:22(-04), Daniel Déchelotte:
[...]
Par pure curiosite : comment faire exactement pour obtenir cette "mise en
forme" ? J'ai tente un bete echo "blabla_AboboAAbibi" > test ; less test
sans succes (enfin si, less m'affiche le texte). A tout hasard, j'ai
essaye less -r, mais decidemment non.


Backspace, c'est b ou 10 ou x8 pour echo (pas tous).

--
Stéphane ["Stephane.Chazelas" arobase "free.fr"]

Avatar
no
On Fri, 24 Oct 2003 00:12:15 +0200, Le Gaulois wrote:

Bonsoir,

Dans les docs Unix il est fréquent qu'on rencontre des fichiers textes
dans lesquels il y a des caractères gras ou soulignés au moyen de
séquences utilisants les backspaces par exemple

_ Backspace A pour A souligné
A Backspace A pour A gras

Si on consulte ça avec un outils destiné à afficher du texte brut,
c'est très pénible à lire. Avec "less" on peut afficher ça
correctement ... sauf s'il y a des lettres accentuées, car
elles sont affichées <81> ...

Quel est le bon moyen pour consulter ces fichiers qui contiennent
ces séquences de backspace et des lettres accentués.


Pour supprimer ces <backspace> tu peux utiliser ça par exemple :

$ cat fic | perl -ne 's/.ch//g;print' > fic2

Avatar
Thierry Boudet
Le 23-10-2003, Le Gaulois a écrit :

Quel est le bon moyen pour consulter ces fichiers qui contiennent
ces séquences de backspace et des lettres accentués.


Je pense que "col -b" doit le faire, avec réserve pour les
caractères accentués.

--
David Lightman: Is this a game or is it real?
Joshua: What's the difference?
David Lightman: Oh, wow.

Avatar
Le Gaulois
Bonjour,

Merci à tous pour vos réponses