Voilà, j'ai du vieux code bien cracra (20 ans d'age) à qui il arrive
de traiter du texte. Avec des casts de goret dedans. Et maintenant,
je voudrais que ce machin comprenne l'utf-8 de manière propre.
Voici donc deux questions :
- Où trouver un guide des bonnes pratiques dans ce domaine ?
- Vers quoi me tourner pour une conversion utf-8 -> CP437 ?
Ce qui me fait penser à un autre problème de UTF-8 (qui a été beaucoup «exploité»), qui sont les faux encodages : exemple (utilisé par Java), "xC0x80" «représente» la même chose que "