Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

C et Unicode

4 réponses
Avatar
unbewust
y a t'il une faq concernant C et Unicode ???

4 réponses

Avatar
espie
In article ,
unbewust wrote:
y a t'il une faq concernant C et Unicode ???


Pas que je sache. Tu es interesse par quoi ?
- les caracteres unicode dans les programmes C -> il y a ce qu'il faut
dans la norme pour que ca soit possible. Il faut generalement des versions
recentes de preprocesseur et de compilo pour que ca fonctionne.
- la manipulation de caracteres unicode par un programme C -> rien de
specifique dans la norme. Il y a juste des fonctions de manipulations de
caracteres etendues qui sont dependantes du locale, et donc selon
l'implementation, on peut trouver de l'unicode dans les formats supportes...
- l'encodage magique utf8, qui peut se manipuler `presque' comme des chaines
de caracteres normales, tant qu'on ne regarde pas trop ce qu'il en est,
et qu'on n'est pas trop interesse par le nombre de caracteres effectivement
contenus dans la chaine.
- les trous de securite inherents aux divers encodages unicode, avec toutes
les conneries a ne pas faire lorsqu'on decode une chaine multibyte...

j'en passe et des meilleures.

Avatar
unbewust
On 11 août, 15:28, (Marc Espie) wrote:
In article ,

unbewust wrote:
y a t'il une faq concernant C et Unicode ???


Pas que je sache. Tu es interesse par quoi ?
- les caracteres unicode dans les programmes C -> il y a ce qu'il faut
dans la norme pour que ca soit possible. Il faut generalement des versions
recentes de preprocesseur et de compilo pour que ca fonctionne.
- la manipulation de caracteres unicode par un programme C -> rien de
specifique dans la norme. Il y a juste des fonctions de manipulations de
caracteres etendues qui sont dependantes du locale, et donc selon
l'implementation, on peut trouver de l'unicode dans les formats supportes ...
- l'encodage magique utf8, qui peut se manipuler `presque' comme des chai nes
de caracteres normales, tant qu'on ne regarde pas trop ce qu'il en est,
et qu'on n'est pas trop interesse par le nombre de caracteres effectiveme nt
contenus dans la chaine.
- les trous de securite inherents aux divers encodages unicode, avec tout es
les conneries a ne pas faire lorsqu'on decode une chaine multibyte...

j'en passe et des meilleures.



en fait j'écris un module C qui est une extension de Ruby (langage de
script), module pour Mac OS X spécifiquement.

dans MacOS X le ,File Manager sait gérer l'unicode et j'aurais
souhaité passer tous les path (mon module manipule des fichiers) en
UTF-8.


Avatar
Eric Levenez
Le 14/08/07 18:13, dans
, « unbewust »
a écrit :

dans MacOS X le ,File Manager sait gérer l'unicode et j'aurais
souhaité passer tous les path (mon module manipule des fichiers) en
UTF-8.


De toute façon, comme c'est la seule chose possible sur Mac OS X, ça tombe
bien :-)

--
Éric Lévénez -- <http://www.levenez.com/>
Unix is not only an OS, it's a way of life.

Avatar
Pascal Bourguignon
unbewust writes:

On 11 août, 15:28, (Marc Espie) wrote:
In article ,

unbewust wrote:
y a t'il une faq concernant C et Unicode ???


Pas que je sache. Tu es interesse par quoi ?
- les caracteres unicode dans les programmes C -> il y a ce qu'il faut
dans la norme pour que ca soit possible. Il faut generalement des versions
recentes de preprocesseur et de compilo pour que ca fonctionne.
- la manipulation de caracteres unicode par un programme C -> rien de
specifique dans la norme. Il y a juste des fonctions de manipulations de
caracteres etendues qui sont dependantes du locale, et donc selon
l'implementation, on peut trouver de l'unicode dans les formats supportes...
- l'encodage magique utf8, qui peut se manipuler `presque' comme des chaines
de caracteres normales, tant qu'on ne regarde pas trop ce qu'il en est,
et qu'on n'est pas trop interesse par le nombre de caracteres effectivement
contenus dans la chaine.
- les trous de securite inherents aux divers encodages unicode, avec toutes
les conneries a ne pas faire lorsqu'on decode une chaine multibyte...

j'en passe et des meilleures.



en fait j'écris un module C qui est une extension de Ruby (langage de
script), module pour Mac OS X spécifiquement.

dans MacOS X le ,File Manager sait gérer l'unicode et j'aurais
souhaité passer tous les path (mon module manipule des fichiers) en
UTF-8.


Ce n'est pas prudent.

L'utilisateur peut facilement monter un file system qui ne travaille
pas (ou pas uniquement) en UTF-8, et donc qui contiennent des noms
invalides en tant qu'UTF-8. Si on veut pouvoir travailler avec ces
fichiers, il faut le faire au niveau unix normal, et utiliser les
primitives système, pas uniquement les bibliothèques OpenStep.


--
__Pascal Bourguignon__ http://www.informatimago.com/

NOTE: The most fundamental particles in this product are held
together by a "gluing" force about which little is currently known
and whose adhesive power can therefore not be permanently
guaranteed.