C et Unicode

espie

11/08/2007 à 15:28

In article ,
unbewust wrote:

y a t'il une faq concernant C et Unicode ???

Pas que je sache. Tu es interesse par quoi ?
- les caracteres unicode dans les programmes C -> il y a ce qu'il faut
dans la norme pour que ca soit possible. Il faut generalement des versions
recentes de preprocesseur et de compilo pour que ca fonctionne.
- la manipulation de caracteres unicode par un programme C -> rien de
specifique dans la norme. Il y a juste des fonctions de manipulations de
caracteres etendues qui sont dependantes du locale, et donc selon
l'implementation, on peut trouver de l'unicode dans les formats supportes...
- l'encodage magique utf8, qui peut se manipuler `presque' comme des chaines
de caracteres normales, tant qu'on ne regarde pas trop ce qu'il en est,
et qu'on n'est pas trop interesse par le nombre de caracteres effectivement
contenus dans la chaine.
- les trous de securite inherents aux divers encodages unicode, avec toutes
les conneries a ne pas faire lorsqu'on decode une chaine multibyte...

j'en passe et des meilleures.

unbewust

14/08/2007 à 18:13

On 11 août, 15:28, (Marc Espie) wrote:

In article ,

unbewust wrote:
y a t'il une faq concernant C et Unicode ???

Pas que je sache. Tu es interesse par quoi ?
- les caracteres unicode dans les programmes C -> il y a ce qu'il faut
dans la norme pour que ca soit possible. Il faut generalement des versions
recentes de preprocesseur et de compilo pour que ca fonctionne.
- la manipulation de caracteres unicode par un programme C -> rien de
specifique dans la norme. Il y a juste des fonctions de manipulations de
caracteres etendues qui sont dependantes du locale, et donc selon
l'implementation, on peut trouver de l'unicode dans les formats supportes ...
- l'encodage magique utf8, qui peut se manipuler `presque' comme des chai nes
de caracteres normales, tant qu'on ne regarde pas trop ce qu'il en est,
et qu'on n'est pas trop interesse par le nombre de caracteres effectiveme nt
contenus dans la chaine.
- les trous de securite inherents aux divers encodages unicode, avec tout es
les conneries a ne pas faire lorsqu'on decode une chaine multibyte...

j'en passe et des meilleures.

en fait j'écris un module C qui est une extension de Ruby (langage de
script), module pour Mac OS X spécifiquement.

dans MacOS X le ,File Manager sait gérer l'unicode et j'aurais
souhaité passer tous les path (mon module manipule des fichiers) en
UTF-8.

Eric Levenez

14/08/2007 à 18:25

Le 14/08/07 18:13, dans
, « unbewust »
a écrit :

dans MacOS X le ,File Manager sait gérer l'unicode et j'aurais
souhaité passer tous les path (mon module manipule des fichiers) en
UTF-8.

De toute façon, comme c'est la seule chose possible sur Mac OS X, ça tombe
bien :-)

--
Éric Lévénez -- <http://www.levenez.com/>
Unix is not only an OS, it's a way of life.

Pascal Bourguignon

14/08/2007 à 19:46

unbewust writes:

On 11 août, 15:28, (Marc Espie) wrote:
In article ,

unbewust wrote:
y a t'il une faq concernant C et Unicode ???

Pas que je sache. Tu es interesse par quoi ?
- les caracteres unicode dans les programmes C -> il y a ce qu'il faut
dans la norme pour que ca soit possible. Il faut generalement des versions
recentes de preprocesseur et de compilo pour que ca fonctionne.
- la manipulation de caracteres unicode par un programme C -> rien de
specifique dans la norme. Il y a juste des fonctions de manipulations de
caracteres etendues qui sont dependantes du locale, et donc selon
l'implementation, on peut trouver de l'unicode dans les formats supportes...
- l'encodage magique utf8, qui peut se manipuler `presque' comme des chaines
de caracteres normales, tant qu'on ne regarde pas trop ce qu'il en est,
et qu'on n'est pas trop interesse par le nombre de caracteres effectivement
contenus dans la chaine.
- les trous de securite inherents aux divers encodages unicode, avec toutes
les conneries a ne pas faire lorsqu'on decode une chaine multibyte...

j'en passe et des meilleures.

en fait j'écris un module C qui est une extension de Ruby (langage de
script), module pour Mac OS X spécifiquement.

dans MacOS X le ,File Manager sait gérer l'unicode et j'aurais
souhaité passer tous les path (mon module manipule des fichiers) en
UTF-8.

Ce n'est pas prudent.

L'utilisateur peut facilement monter un file system qui ne travaille
pas (ou pas uniquement) en UTF-8, et donc qui contiennent des noms
invalides en tant qu'UTF-8. Si on veut pouvoir travailler avec ces
fichiers, il faut le faire au niveau unix normal, et utiliser les
primitives système, pas uniquement les bibliothèques OpenStep.

--
__Pascal Bourguignon__ http://www.informatimago.com/

NOTE: The most fundamental particles in this product are held
together by a "gluing" force about which little is currently known
and whose adhesive power can therefore not be permanently
guaranteed.

unbewust <yvon.thoraval@gmail.com> writes:

On 11 août, 15:28, es...@lain.home (Marc Espie) wrote:

In article <1186739054.675043.40...@i13g2000prf.googlegroups.com>,

unbewust <yvon.thora...@gmail.com> wrote:

y a t'il une faq concernant C et Unicode ???

Pas que je sache. Tu es interesse par quoi ?
- les caracteres unicode dans les programmes C -> il y a ce qu'il faut
dans la norme pour que ca soit possible. Il faut generalement des versions
recentes de preprocesseur et de compilo pour que ca fonctionne.
- la manipulation de caracteres unicode par un programme C -> rien de
specifique dans la norme. Il y a juste des fonctions de manipulations de
caracteres etendues qui sont dependantes du locale, et donc selon
l'implementation, on peut trouver de l'unicode dans les formats supportes...
- l'encodage magique utf8, qui peut se manipuler `presque' comme des chaines
de caracteres normales, tant qu'on ne regarde pas trop ce qu'il en est,
et qu'on n'est pas trop interesse par le nombre de caracteres effectivement
contenus dans la chaine.
- les trous de securite inherents aux divers encodages unicode, avec toutes
les conneries a ne pas faire lorsqu'on decode une chaine multibyte...

j'en passe et des meilleures.

en fait j'écris un module C qui est une extension de Ruby (langage de
script), module pour Mac OS X spécifiquement.

dans MacOS X le ,File Manager sait gérer l'unicode et j'aurais
souhaité passer tous les path (mon module manipule des fichiers) en
UTF-8.

Ce n'est pas prudent.

L'utilisateur peut facilement monter un file system qui ne travaille
pas (ou pas uniquement) en UTF-8, et donc qui contiennent des noms
invalides en tant qu'UTF-8. Si on veut pouvoir travailler avec ces
fichiers, il faut le faire au niveau unix normal, et utiliser les
primitives système, pas uniquement les bibliothèques OpenStep.

--
__Pascal Bourguignon__ http://www.informatimago.com/

NOTE: The most fundamental particles in this product are held
together by a "gluing" force about which little is currently known
and whose adhesive power can therefore not be permanently
guaranteed.

Vous avez filtré cet utilisateur ! Consultez son message

C et Unicode

4 réponses

Veuillez sélectionner un problème