Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

cherche outil en ligne de commande qui détecte l'encodage de fichiers html

3 réponses
Avatar
pere.noel
je cherche un outil en ligne de commande qui détecte l'encodage de
fichiers html.

en effet afin de manipuler des fichiers html en UTF-8 je dois d'abord
connaître leur encodage (afin de les convertir), je ne puis me fier au
charset définit dans une des balises meta (parfois fausse) ni dans les
headers http car je suis off-line.

sur MacOS X file ne marche pas sur les fichiers html, ou plutot ca ne
retourne que text/html et pas l'encodage...
--
une bévue

3 réponses

Avatar
blanc
Une bévue wrote:

je cherche un outil en ligne de commande qui détecte l'encodage de
fichiers html.


Je ne suis pas sûr que ça soit ce que tu cherches, d'ailleurs ça ne
semble pas en CLI, mais j'ai trouvé ça :

<http://www.macupdate.com/info.php/id/16825>

JPaul.
--
/==/==- Jean-Paul BLANC
/ /--/--// quelque-part (somewhere)
|/| L | en (in)
/|| = ||| FRANCE

Avatar
pere.noel
JPaul wrote:


Je ne suis pas sûr que ça soit ce que tu cherches, d'ailleurs ça ne
semble pas en CLI, mais j'ai trouvé ça :

<http://www.macupdate.com/info.php/id/16825>


oui, non merci, j'ai trouvé "mon bonheur" par deux regexp l'une pour
ascii et l'autre pour utf-8, les autre encodages sont , théoriquement,
non discriminables directement, j'utilise texcat qui matche
simultanément le langage et l'encodage, pourvu qu'on lui fournisse des
exemples.
--
une bévue

Avatar
blanc
Une bévue wrote:

oui, non merci, j'ai trouvé "mon bonheur" par deux regexp l'une pour
ascii et l'autre pour utf-8, les autre encodages sont , théoriquement,
non discriminables directement, j'utilise texcat qui matche
simultanément le langage et l'encodage, pourvu qu'on lui fournisse des
exemples.


OK...

JPaul.
--
/==/==- Jean-Paul BLANC
/ /--/--// quelque-part (somewhere)
|/| L | en (in)
/|| = ||| FRANCE