comment faire pour que mon texte soit lisble une tranformation s'impose , mais laquelle
Deux transformations en fait :
La première concerne le jeu de caractères. Visiblement cette page est en utf-8. Mais cela peut varier selon les pages et il faudra alors examiner le contenu pour en extraire le charset.
La deuxième concerne le remplacement des entités html par le caractères correspondant. Il est d'ailleurs curieux qu'une page en utf-8 utilise ces entités. ex : é <=> é à <=> à etc ... Fait une recherche sur les entités html ou html entities pour les retrouver toutes.
Pour le premier point, il faut passer par les API ou reprogrammer un algorithme de conversion utf-8 -> Unicode http://www.codyx.org/snippet_ainsi-vers-utf8-vice-versa_54.aspx
-- Fred http://www.cerber mail.com/?3kA6ftaCvT (enlever l'espace)
Dans : news:mn.1b0e7d776f258906.24667@wanadoo.fr,
John-Pet disait :
Bonjours
Bonjour,
je recupere sur internet le code source d'une page HTML
comment faire pour que mon texte soit lisble
une tranformation s'impose , mais laquelle
Deux transformations en fait :
La première concerne le jeu de caractères. Visiblement cette page est en
utf-8. Mais cela peut varier selon les pages et il faudra alors examiner
le contenu pour en extraire le charset.
La deuxième concerne le remplacement des entités html par le caractères
correspondant. Il est d'ailleurs curieux qu'une page en utf-8 utilise
ces entités.
ex :
é <=> é
à <=> à
etc ... Fait une recherche sur les entités html ou html entities pour
les retrouver toutes.
Pour le premier point, il faut passer par les API ou reprogrammer un
algorithme de conversion utf-8 -> Unicode
http://www.codyx.org/snippet_ainsi-vers-utf8-vice-versa_54.aspx
--
Fred
http://www.cerber mail.com/?3kA6ftaCvT (enlever l'espace)
comment faire pour que mon texte soit lisble une tranformation s'impose , mais laquelle
Deux transformations en fait :
La première concerne le jeu de caractères. Visiblement cette page est en utf-8. Mais cela peut varier selon les pages et il faudra alors examiner le contenu pour en extraire le charset.
La deuxième concerne le remplacement des entités html par le caractères correspondant. Il est d'ailleurs curieux qu'une page en utf-8 utilise ces entités. ex : é <=> é à <=> à etc ... Fait une recherche sur les entités html ou html entities pour les retrouver toutes.
Pour le premier point, il faut passer par les API ou reprogrammer un algorithme de conversion utf-8 -> Unicode http://www.codyx.org/snippet_ainsi-vers-utf8-vice-versa_54.aspx
-- Fred http://www.cerber mail.com/?3kA6ftaCvT (enlever l'espace)
John-Pet
Ok merci Fred je vais regarder tout çà
JP
Fred a écrit :
Dans : news:, John-Pet disait :
Bonjours
Bonjour,
je recupere sur internet le code source d'une page HTML
comment faire pour que mon texte soit lisble une tranformation s'impose , mais laquelle
Deux transformations en fait :
La première concerne le jeu de caractères. Visiblement cette page est en utf-8. Mais cela peut varier selon les pages et il faudra alors examiner le contenu pour en extraire le charset.
La deuxième concerne le remplacement des entités html par le caractères correspondant. Il est d'ailleurs curieux qu'une page en utf-8 utilise ces entités. ex : é <=> é à <=> à etc ... Fait une recherche sur les entités html ou html entities pour les retrouver toutes.
Pour le premier point, il faut passer par les API ou reprogrammer un algorithme de conversion utf-8 -> Unicode http://www.codyx.org/snippet_ainsi-vers-utf8-vice-versa_54.aspx
-- Adresse mail : Ceci est une signature automatique de MesNews. Site : http://www.mesnews.net
Ok merci Fred
je vais regarder tout çà
JP
Fred a écrit :
Dans : news:mn.1b0e7d776f258906.24667@wanadoo.fr,
John-Pet disait :
Bonjours
Bonjour,
je recupere sur internet le code source d'une page HTML
comment faire pour que mon texte soit lisble
une tranformation s'impose , mais laquelle
Deux transformations en fait :
La première concerne le jeu de caractères. Visiblement cette page est en
utf-8. Mais cela peut varier selon les pages et il faudra alors examiner le
contenu pour en extraire le charset.
La deuxième concerne le remplacement des entités html par le caractères
correspondant. Il est d'ailleurs curieux qu'une page en utf-8 utilise ces
entités.
ex :
é <=> é
à <=> à
etc ... Fait une recherche sur les entités html ou html entities pour les
retrouver toutes.
Pour le premier point, il faut passer par les API ou reprogrammer un
algorithme de conversion utf-8 -> Unicode
http://www.codyx.org/snippet_ainsi-vers-utf8-vice-versa_54.aspx
--
Adresse mail : john-pet@wanadoo.fr
Ceci est une signature automatique de MesNews.
Site : http://www.mesnews.net
comment faire pour que mon texte soit lisble une tranformation s'impose , mais laquelle
Deux transformations en fait :
La première concerne le jeu de caractères. Visiblement cette page est en utf-8. Mais cela peut varier selon les pages et il faudra alors examiner le contenu pour en extraire le charset.
La deuxième concerne le remplacement des entités html par le caractères correspondant. Il est d'ailleurs curieux qu'une page en utf-8 utilise ces entités. ex : é <=> é à <=> à etc ... Fait une recherche sur les entités html ou html entities pour les retrouver toutes.
Pour le premier point, il faut passer par les API ou reprogrammer un algorithme de conversion utf-8 -> Unicode http://www.codyx.org/snippet_ainsi-vers-utf8-vice-versa_54.aspx
-- Adresse mail : Ceci est une signature automatique de MesNews. Site : http://www.mesnews.net