OVH Cloud OVH Cloud

Re: bash et UTF-8

42 réponses
Avatar
denis31.barbier
[Laurent Giroud]
> Ca c'est bizarre.
> L'UTF-8 est calqu=E9 quasiment identiquement sur
> l'iso-8859-15 pour les 8 premiers bits.

Tu confonds la table des caract=E8res et le codage utilis=E9.

> > > La faiblesse est plut=F4t du c=F4t=E9 des logiciels qui
> > > ne g=E8rent pas correctement l'unicode, en effet, si
> > > on utilise la libc GNU standard et qu'on utilise
> > > gettext pour la localisation, il suffit d'utiliser
> > > wprintf au lieu de printf, de ne plus utiliser les
> > > "char" (en C) mais les "wchar" et de veiller =E0 ne
> > > pas tester les cha=EEnes de caract=E8res "en dur" mais
> > > d'utiliser syst=E9matiquement des cha=EEnes localis=E9es.
> >
> > arrfff... il "suffit"...
>
> Ce n'est pas l'utilisation d'un "il suffit" qui permet
> de dire que c'est irr=E9aliste, c'est l'ampleur de la
> t=E2che que =E7a repr=E9sente.

C'est bien beau de se documenter, encore faut-il passer =E0
la pratique ;)

Si tout ce qui t'int=E9resse est de fournir un bon support
pour l'UTF-8, la solution la plus simple est de conserver
des char et de changer les routines de calcul de
longueur de cha=EEnes, recherche d'expressions, etc. C'est
ce que fait la majorit=E9 des programmeurs, avec
=E9ventuellement conversion du codage si l'utilisateur
n'est pas en UTF-8.

Ce que tu d=E9cris avec wchar est autre chose, mais les
ayatollahs de l'UTF-8 sont contre car =E7a permet aux
codages existants (8-bit ou multibyte) de continuer =E0
=EAtre support=E9s, alors qu'il faudrait les =E9radiquer.

Les 2 approches requi=E8rent beaucoup plus de travail que
tu ne sembles l'imaginer.

--
Denis=0A=0AAcc=E9dez au courrier =E9lectronique de La Poste : www.laposte=
.net ; =0A3615 LAPOSTENET (0,34=80/mn) ; t=E9l : 08 92 68 13 50 (0,34=80/=
mn)=0A=0A

10 réponses

1 2 3 4 5
Avatar
Erwan David
Le Tue 3/08/2004, Michelle Konzack disait
Am 2004-08-03 19:53:40, schrieb Erwan David:

> le compilo interprète le source selon le système (sous unix la
> locale)... et un windows en français c'est du CP-1252...

J'ai le Win 2003 Entreprise Server (original US et un allemand)
et tous le deux travailler avec UTF-8 et j'ai des problem massiv !



Au boulot ce sont des windows 2000 Pro.

--
Erwan


--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
Erwan David
Le Tue 3/08/2004, Vincent Lefevre disait
On 2004-08-03 21:51:06 +0200, Erwan David wrote:
> j'ai des problèmes avec ncurses qui intercepte certaines combianisons
> de touches sur lesquelles j'ai des macros...

Jamais remarqué cela.

> genre C-s par exemple (qui note le mail comme un spam pour bogofilter)

Aucun problème avec C-s chez moi. Tu es sûr que ce n'est pas le
terminal qui intercepte le C-s (comportement par défaut)?



Vu que ça le fait avec un mutt compilé avec ncurses et pas avec un
mutt compilé avec slang...

Avant
de lancer Mutt dans un terminal, tu peux faire un

stty -ixon

pour désactiver le contrôle de flux; ainsi, C-s et C-q ne seront
plus interceptés. D'ailleurs, j'ai également ça dans mon ".zshrc".
Ça fonctionne avec Slang peut-être parce que Slang désactive
lui-même le contrôle de flux.

Pour d'autres trucs concernant ma config Mutt:

http://www.vinc17.org/mutt/index.fr.html



Faudra tester, mais ça veut dire faire un wrapper pour lancer mutt
dans un xterm. Je testerai à l'occasion.

--
Erwan


--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
Michelle Konzack
--eMnpOGXCMazMAbfp
Content-Type: text/plain; charset=iso-8859-1
Content-Disposition: inline
Content-Transfer-Encoding: quoted-printable

Am 2004-08-03 23:26:17, schrieb Erwan David:
Le Tue 3/08/2004, Michelle Konzack disait
> Am 2004-08-03 19:53:40, schrieb Erwan David:
>
> > le compilo interprète le source selon le système (sous unix la
> > locale)... et un windows en français c'est du CP-1252...
>
> J'ai le Win 2003 Entreprise Server (original US et un allemand)
> et tous le deux travailler avec UTF-8 et j'ai des problem massiv !

Au boulot ce sont des windows 2000 Pro.



M$ change ca avec chaque nouvel version... :-/
Je les deux 2003 chez moi, parce que je porte quelque logiciel de
l'etat sur Linux... Je ne sais pas, pourquoi je travailler avec
cet mer...

Apres chaque mise-a-jour de Windows j'ai plus de incompatibilite.

Greetings
Michelle

--
Linux-User #280138 with the Linux Counter, http://counter.li.org/
Michelle Konzack Apt. 917 ICQ #328449886
50, rue de Soultz MSM LinuxMichi
0033/3/88452356 67100 Strasbourg/France IRC #Debian (irc.icq.com)

--eMnpOGXCMazMAbfp
Content-Type: application/pgp-signature; name="signature.pgp"
Content-Description: Digital signature
Content-Disposition: inline

-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.2.4 (GNU/Linux)

iD8DBQFBEAYkC0FPBMSS+BIRAtfxAKCI0VplUbevKlzX1TC9DSRLtF3k+wCfWfrr
zvtXSjf35q3cQZMwf/5p4Us =3Wdy
-----END PGP SIGNATURE-----

--eMnpOGXCMazMAbfp--


--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
Erwan David
Le Tue 3/08/2004, Michelle Konzack disait
Am 2004-08-03 19:54:32, schrieb Erwan David:
> Le Tue 3/08/2004, Vincent Lefevre disait
> > On 2004-08-03 15:55:57 +0200, Laurent Giroud wrote:
> > > Certes, donc la meilleure solution est bien le passage le plus
> > > rapide possible à l'UTF-8 comme format par défaut.
> >
> > Une fois que zsh supportera l'UTF-8, c'est la première chose que je
> > ferai. :)
>
> Moi aussi à conditipon de trouver comment compiler mon mutt avec le sla ng-utf8...

Pour WOODY ???

apt-get install mutt-utf8


ou un version plus nouveau ?



Je suis en sid, les options de compilations du paquet ne me
conviennent pas :
1) il en manque d'indispensables comme enable-buffy-size

2) le support mixmaster est mmis ce qui pour moi ets politiquement
innacceptable. Quand on s'est fait mailbomber et menacer de morts
par des petits cons à qui ce genre de système assure l'impunité on
ne va pas installer un soft qui le supporte.


--
Erwan


--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
fra-duf-no-spam
Le 12633ième jour après Epoch,
Vincent Lefevre écrivait:

On 2004-08-03 19:54:32 +0200, Erwan David wrote:
Le Tue 3/08/2004, Vincent Lefevre disait
> Une fois que zsh supportera l'UTF-8, c'est la première chose que je
> ferai. :)

Moi aussi à conditipon de trouver comment compiler mon mutt avec le sla ng-utf8...



C'est bizarre, il y a apparemment un caractère de contrôle entre "sla"
et "ng-utf8" (ça me fait un retour à la ligne entre les deux, mais ce
n'est pas un n).



Ça se nomme "tabulation", et est accessible avec la grosse touche
rectangulaire à gauche du clavier, tellement proche du "a" que des
fois on fait les deux à la fois.

Ok... je --->[]


--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
Erwan David
Le Tue 3/08/2004, François TOURDE disait
Le 12633ième jour après Epoch,
Vincent Lefevre écrivait:

> On 2004-08-03 19:54:32 +0200, Erwan David wrote:
>> Le Tue 3/08/2004, Vincent Lefevre disait
>> > Une fois que zsh supportera l'UTF-8, c'est la première chose que je
>> > ferai. :)
>>
>> Moi aussi à conditipon de trouver comment compiler mon mutt avec le sla ng-utf8...
>
> C'est bizarre, il y a apparemment un caractère de contrôle entre "sla"
> et "ng-utf8" (ça me fait un retour à la ligne entre les deux, mais ce
> n'est pas un n).

Ça se nomme "tabulation", et est accessible avec la grosse touche
rectangulaire à gauche du clavier, tellement proche du "a" que des
fois on fait les deux à la fois.

Ok... je --->[]



Ben non, c'est tout à fait ça...

--
Erwan


--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
fra-duf-no-spam
Le 12633ième jour après Epoch,
Erwan David écrivait:

Le Tue 3/08/2004, François TOURDE disait
Le 12633ième jour après Epoch,
Vincent Lefevre écrivait:

> On 2004-08-03 19:54:32 +0200, Erwan David wrote:
>> Le Tue 3/08/2004, Vincent Lefevre disait
>> > Une fois que zsh supportera l'UTF-8, c'est la première chose que je
>> > ferai. :)
>>
>> Moi aussi à conditipon de trouver comment compiler mon mutt avec le sla ng-utf8...
>
> C'est bizarre, il y a apparemment un caractère de contrôle entre "sla"
> et "ng-utf8" (ça me fait un retour à la ligne entre les deux, mais ce
> n'est pas un n).

Ça se nomme "tabulation", et est accessible avec la grosse touche
rectangulaire à gauche du clavier, tellement proche du "a" que des
fois on fait les deux à la fois.

Ok... je --->[]



Ben non, c'est tout à fait ça...



Oui, je sais, mais c'est pour le ton "sarcastique" employé que je me
proposais de sortir :)


--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
Vincent Lefevre
On 2004-08-03 23:41:55 +0200, Erwan David wrote:
Je suis en sid, les options de compilations du paquet ne me
conviennent pas :
1) il en manque d'indispensables comme enable-buffy-size

2) le support mixmaster est mmis ce qui pour moi ets politiquement
innacceptable. Quand on s'est fait mailbomber et menacer de morts
par des petits cons à qui ce genre de système assure l'impunité on
ne va pas installer un soft qui le supporte.



Idem. Il manque aussi le patch savehist. :)

--
Vincent Lefèvre - Web: <http://www.vinc17.org/>
100% validated (X)HTML - Acorn / RISC OS / ARM, free software, YP17,
Championnat International des Jeux Mathématiques et Logiques, etc.
Work: CR INRIA - computer arithmetic / SPACES project at LORIA


--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
Gabriel Paubert
On Tue, Aug 03, 2004 at 11:12:28PM +0200, François TOURDE wrote:
Le 12633ième jour après Epoch,
Vincent Lefevre écrivait:

> On 2004-08-03 19:54:32 +0200, Erwan David wrote:
>> Le Tue 3/08/2004, Vincent Lefevre disait
>> > Une fois que zsh supportera l'UTF-8, c'est la première chose que je
>> > ferai. :)
>>
>> Moi aussi à conditipon de trouver comment compiler mon mutt avec le sla ng-utf8...
>
> C'est bizarre, il y a apparemment un caractère de contrôle entre "sla"
> et "ng-utf8" (ça me fait un retour à la ligne entre les deux, mais ce
> n'est pas un n).

Ça se nomme "tabulation", et est accessible avec la grosse touche
rectangulaire à gauche du clavier, tellement proche du "a" que des
fois on fait les deux à la fois.

Ok... je --->[]



Bizarrerie des claviers français, dans mon cas elle est à
côté du "q", si j'ose m'exprimer ainsi. A gauche du "a", il
y a l'insupportable "Caps Lock", dont elle est séparée un
peu sur certains claviers où elle fait exactement la même
largeur que la tabulation.

Enfin c'est sur un clavier espagnol, qui a aussi une touche
"ç" qui produit "Ç" en majuscules. Etonnant, non?

Bon, je sors aussi.

Gabriel


--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
Loic Minier
Michelle Konzack - Tue, Aug 03, 2004:

J'ai le Win 2003 Entreprise Server (original US et un allemand)
et tous le deux travailler avec UTF-8 et j'ai des problem massiv !



Tu as quel genre de problèmes ?

J'ai du mal à comprendre comment on peut avoir des problèmes avec
l'UTF-8 sous Windows.

--
Loïc Minier


--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
1 2 3 4 5