Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

MODE CP et utf-8

3 réponses
Avatar
Michel Claveau - abstraction méta-galactique non triviale en fuite perpétuelle.
Bonjour !


Avec une instruction comme :
MODE CON: CP SELECT=1252
J'obtiens une console en cp1252.


Mais comment faire, pour avoir une console en UTF-8 (ou UTF-16, si c'est
plus facile pour windows, qui est sensé gérer nativement cet encodage).

Pour info, mon uniscribe est à jour.


Merci d'avance.
--
Michel Claveau

3 réponses

Avatar
jbongran
Michel Claveau - abstraction méta-galactique non triviale en fuite
perpétuelle. wrote:
Bonjour !


Avec une instruction comme :
MODE CON: CP SELECT52
J'obtiens une console en cp1252.


Mais comment faire, pour avoir une console en UTF-8 (ou UTF-16, si
c'est plus facile pour windows, qui est sensé gérer nativement cet
encodage).

Pour info, mon uniscribe est à jour.


Merci d'avance.


Tu peux essayer (sans garantie) les codes pages suivants:
utf-7 65000 Universal Alphabet (UTF-7)
utf-8 65001 Universal Alphabet (UTF-8)
Ce devraient être des pseudo codepage supportant l'utf7 et 8
Pas plus de certitude que ça, tiens nous au courant.

Avatar
Michel Claveau - abstraction méta-galactique non triviale en fuite perpétuelle.
Bonjour !


D'abord, merci de t'être penché sur ma question.

Maintenant le résultat des tests : c'est pas terrible. Le code-page est bien
accepté, il se met en place (si l'on en croit le résultat de la commande
"MODE"). Mais, lorsqu'on veut visualiser des données en UTF-8, seuls
certains caractères sont correctement représentés. Notamment les jeux de
polices latines, cyrilliques, grecques. Mais, les polices asiatiques sont
toutes remplacées par un rectangle blanc et vide.

De plus, dans ce mode, je suis tombé sur quelques problèmes d'interprétation
des "low ascii" (autrement dit des caractères d'échappement), comme les
retours-chariots, ou les fins de fichiers.

J'ai l'impression que ne sont supportés que les caractères présents dans les
codes-pages "standards" de windows (voir
http://www.microsoft.com/globaldev/reference/WinCP.mspx)

En plus, cela correspond aux mêmes limitations d'usage que l'on rencontre
avec SciTE, notamment.




Autre chose, j'ai voulu essayer les codes-pages utf-16 (1200 en little
endian, et 1201 en big endian). Mais, là, MODE refuse d'aller plus loin que
: "La page de codes spécifiée n'est pas valide."



Et tous ces (petits) soucis s'ajoutent à d'autres, dans windows (problèmes
de copier/coller unicode ; difficultés avec le moteur uniscribe ; flou dans
la définition Unicode/windows des encodages par défaut ; limitations des
outils, malgré des propos "commerciaux" dithyrambiques). Du coup, je vais
renoncer à travailler nativement en UTF-8. Je regarderai à nouveau avec
longhorn...



Bonne journée
--
Michel Claveau
Avatar
Michel Claveau - abstraction méta-galactique non triviale en fuite perpétuelle.
Re

Je retire une phrase de mon message précédent (ou plutôt, je la
remplace).


Avec SciTE, si l'on va modifier le fichier "SciTEGlobal.properties", à la
section "if PLAT_WIN", pour indiquer, comme police de caractères "Arial
Unicode MS", on obtient bien l'affichage des caractères Unicode.

Du coup, le copier/coller en Unicode fonctionne également (avec SciTE, au
moins).


Petits rappels :
- il faut que la police Arial Unicode MS soit installée sur le système
(pas si évident que ça)
- le moteur Uniscribe doit être à niveau (mais le SP2 de XP installe la
dernière version)


Bonne journée
--
Michel Claveau