> Cool. C'est bien de refaire le monde, j'esper que ce cas prend en charge les 100 000 caracteres de l'Unicode comme il faut...
100 000 sur 16 bits :)
Bravo.
Møgluglu
patrox a écrit:
100 000 sur 16 bits :)
Sur 20 bits. Unicode associe à chaque caractère un nombre entre 1 et 1 million environ (100 000 sont alloués actuellement).
Ces nombres sont ensuite codés d'après (au moins) 3 formats de codage :
UTF-32 : chaque caractère occupe 4 octets UTF-16 : un caractère occupe 2 ou 4 octets UTF-8 : entre 1 et 4 octets
Dans les premières version d'Unicode, seule la représentation sur 16-bit existait et il y avait moins de 65 000 caractères donc tout marchait bien. Mais depuis ils se sont aperçu que 65 000 ça n'était pas du tout suffisant...
Ça explique que dans la doc Windows ils parlent encore de « chaîne Unicode », alors que le terme exact serait chaîne UTF-16.
-- Møgluglu
patrox a écrit:
100 000 sur 16 bits :)
Sur 20 bits.
Unicode associe à chaque caractère un nombre entre 1 et 1 million
environ (100 000 sont alloués actuellement).
Ces nombres sont ensuite codés d'après (au moins) 3 formats de codage :
UTF-32 : chaque caractère occupe 4 octets
UTF-16 : un caractère occupe 2 ou 4 octets
UTF-8 : entre 1 et 4 octets
Dans les premières version d'Unicode, seule la représentation sur 16-bit
existait et il y avait moins de 65 000 caractères donc tout marchait
bien. Mais depuis ils se sont aperçu que 65 000 ça n'était pas du tout
suffisant...
Ça explique que dans la doc Windows ils parlent encore de « chaîne
Unicode », alors que le terme exact serait chaîne UTF-16.
Sur 20 bits. Unicode associe à chaque caractère un nombre entre 1 et 1 million environ (100 000 sont alloués actuellement).
Ces nombres sont ensuite codés d'après (au moins) 3 formats de codage :
UTF-32 : chaque caractère occupe 4 octets UTF-16 : un caractère occupe 2 ou 4 octets UTF-8 : entre 1 et 4 octets
Dans les premières version d'Unicode, seule la représentation sur 16-bit existait et il y avait moins de 65 000 caractères donc tout marchait bien. Mais depuis ils se sont aperçu que 65 000 ça n'était pas du tout suffisant...
Ça explique que dans la doc Windows ils parlent encore de « chaîne Unicode », alors que le terme exact serait chaîne UTF-16.