cherche outil en ligne de commande qui détecte l'encodage de fichiers html
3 réponses
pere.noel
je cherche un outil en ligne de commande qui détecte l'encodage de
fichiers html.
en effet afin de manipuler des fichiers html en UTF-8 je dois d'abord
connaître leur encodage (afin de les convertir), je ne puis me fier au
charset définit dans une des balises meta (parfois fausse) ni dans les
headers http car je suis off-line.
sur MacOS X file ne marche pas sur les fichiers html, ou plutot ca ne
retourne que text/html et pas l'encodage...
--
une bévue
je cherche un outil en ligne de commande qui détecte l'encodage de fichiers html.
Je ne suis pas sûr que ça soit ce que tu cherches, d'ailleurs ça ne semble pas en CLI, mais j'ai trouvé ça :
<http://www.macupdate.com/info.php/id/16825>
JPaul. -- /==/==- Jean-Paul BLANC / /--/--// quelque-part (somewhere) |/| L | en (in) /|| = ||| FRANCE
pere.noel
JPaul wrote:
Je ne suis pas sûr que ça soit ce que tu cherches, d'ailleurs ça ne semble pas en CLI, mais j'ai trouvé ça :
<http://www.macupdate.com/info.php/id/16825>
oui, non merci, j'ai trouvé "mon bonheur" par deux regexp l'une pour ascii et l'autre pour utf-8, les autre encodages sont , théoriquement, non discriminables directement, j'utilise texcat qui matche simultanément le langage et l'encodage, pourvu qu'on lui fournisse des exemples. -- une bévue
JPaul <blanc@empty.org> wrote:
Je ne suis pas sûr que ça soit ce que tu cherches, d'ailleurs ça ne
semble pas en CLI, mais j'ai trouvé ça :
<http://www.macupdate.com/info.php/id/16825>
oui, non merci, j'ai trouvé "mon bonheur" par deux regexp l'une pour
ascii et l'autre pour utf-8, les autre encodages sont , théoriquement,
non discriminables directement, j'utilise texcat qui matche
simultanément le langage et l'encodage, pourvu qu'on lui fournisse des
exemples.
--
une bévue
Je ne suis pas sûr que ça soit ce que tu cherches, d'ailleurs ça ne semble pas en CLI, mais j'ai trouvé ça :
<http://www.macupdate.com/info.php/id/16825>
oui, non merci, j'ai trouvé "mon bonheur" par deux regexp l'une pour ascii et l'autre pour utf-8, les autre encodages sont , théoriquement, non discriminables directement, j'utilise texcat qui matche simultanément le langage et l'encodage, pourvu qu'on lui fournisse des exemples. -- une bévue
blanc
Une bévue wrote:
oui, non merci, j'ai trouvé "mon bonheur" par deux regexp l'une pour ascii et l'autre pour utf-8, les autre encodages sont , théoriquement, non discriminables directement, j'utilise texcat qui matche simultanément le langage et l'encodage, pourvu qu'on lui fournisse des exemples.
OK...
JPaul. -- /==/==- Jean-Paul BLANC / /--/--// quelque-part (somewhere) |/| L | en (in) /|| = ||| FRANCE
Une bévue <pere.noel@laponie.com.invalid> wrote:
oui, non merci, j'ai trouvé "mon bonheur" par deux regexp l'une pour
ascii et l'autre pour utf-8, les autre encodages sont , théoriquement,
non discriminables directement, j'utilise texcat qui matche
simultanément le langage et l'encodage, pourvu qu'on lui fournisse des
exemples.
OK...
JPaul.
--
/==/==\- Jean-Paul BLANC
/ /--/--//\ quelque-part (somewhere)
|/| L |\ en (in)
/|| = |||\ FRANCE
oui, non merci, j'ai trouvé "mon bonheur" par deux regexp l'une pour ascii et l'autre pour utf-8, les autre encodages sont , théoriquement, non discriminables directement, j'utilise texcat qui matche simultanément le langage et l'encodage, pourvu qu'on lui fournisse des exemples.
OK...
JPaul. -- /==/==- Jean-Paul BLANC / /--/--// quelque-part (somewhere) |/| L | en (in) /|| = ||| FRANCE