Le principe de templates/modeles de documents est désormais très répandu
pour publier de l'information dynamique (jsp, php, ..).
Est-ce que quelqu'un aurait connaissance d'un mécanisme d'anti-template ?
càd l'on définirait des pages formées contenant des balises spécifiques
destinées non pas à publier des infos dans des pages mais à récupérer des
infos dans des pages.
Merci de publier des pointeurs si cela existe
Tant pour expliquer que si qqun est interessé pour se lancer dedans, voici
un mini cdc
Les parametres généraux à fournir seraient :
* url de la page
* reference du template à appliquer
et pour chaque balise:
* nom du champs java / nom d'une étiquette permettant de récupérer l'info
par la suite
* longueur min
* longueur max
Merci de votre attention.
--
Jérôme B
http://contrepeteries.free.fr (entrée libre, sortie gratuite, contributions
en décalages de sons bienvenues)
Cette action est irreversible, confirmez la suppression du commentaire ?
Signaler le commentaire
Veuillez sélectionner un problème
Nudité
Violence
Harcèlement
Fraude
Vente illégale
Discours haineux
Terrorisme
Autre
Bruno Nogent
un genre de processeur xslt inverse en fait ?
"Jerome B" wrote in message news:40e3d76b$0$10975$
Bonjour,
Le principe de templates/modeles de documents est désormais très répandu pour publier de l'information dynamique (jsp, php, ..).
Est-ce que quelqu'un aurait connaissance d'un mécanisme d'anti-template ? càd l'on définirait des pages formées contenant des balises spécifiques destinées non pas à publier des infos dans des pages mais à récupérer des infos dans des pages.
Merci de publier des pointeurs si cela existe
Tant pour expliquer que si qqun est interessé pour se lancer dedans, voici un mini cdc Les parametres généraux à fournir seraient : * url de la page * reference du template à appliquer
et pour chaque balise: * nom du champs java / nom d'une étiquette permettant de récupérer l'info par la suite * longueur min * longueur max
Merci de votre attention.
-- Jérôme B http://contrepeteries.free.fr (entrée libre, sortie gratuite, contributions
en décalages de sons bienvenues)
un genre de processeur xslt inverse en fait ?
"Jerome B" <jbaton_IdonTLike_SPAM@spam_spam_spam__oxymel.com> wrote in
message news:40e3d76b$0$10975$636a15ce@news.free.fr...
Bonjour,
Le principe de templates/modeles de documents est désormais très répandu
pour publier de l'information dynamique (jsp, php, ..).
Est-ce que quelqu'un aurait connaissance d'un mécanisme d'anti-template ?
càd l'on définirait des pages formées contenant des balises spécifiques
destinées non pas à publier des infos dans des pages mais à récupérer des
infos dans des pages.
Merci de publier des pointeurs si cela existe
Tant pour expliquer que si qqun est interessé pour se lancer dedans, voici
un mini cdc
Les parametres généraux à fournir seraient :
* url de la page
* reference du template à appliquer
et pour chaque balise:
* nom du champs java / nom d'une étiquette permettant de récupérer l'info
par la suite
* longueur min
* longueur max
Merci de votre attention.
--
Jérôme B
http://contrepeteries.free.fr (entrée libre, sortie gratuite,
contributions
"Jerome B" wrote in message news:40e3d76b$0$10975$
Bonjour,
Le principe de templates/modeles de documents est désormais très répandu pour publier de l'information dynamique (jsp, php, ..).
Est-ce que quelqu'un aurait connaissance d'un mécanisme d'anti-template ? càd l'on définirait des pages formées contenant des balises spécifiques destinées non pas à publier des infos dans des pages mais à récupérer des infos dans des pages.
Merci de publier des pointeurs si cela existe
Tant pour expliquer que si qqun est interessé pour se lancer dedans, voici un mini cdc Les parametres généraux à fournir seraient : * url de la page * reference du template à appliquer
et pour chaque balise: * nom du champs java / nom d'une étiquette permettant de récupérer l'info par la suite * longueur min * longueur max
Merci de votre attention.
-- Jérôme B http://contrepeteries.free.fr (entrée libre, sortie gratuite, contributions
en décalages de sons bienvenues)
Jerome B
Oui, c'est ça au lieu de HTMLenXSL + données en XML >--produit--> HTML avec les infos dedans on aurait : HTML avec les infos dedans + HTML bis (semblable mais avec balises spécifiques) >--produit--> objet Java ou fichier XML.
Jérôme B http://contrepeteries.free.fr (entrée libre, sortie gratuite)
"Bruno Nogent" a écrit dans le message de news: cc0mlb$ahk$
un genre de processeur xslt inverse en fait ?
"Jerome B" wrote in message news:40e3d76b$0$10975$
Bonjour,
Le principe de templates/modeles de documents est désormais très répandu pour publier de l'information dynamique (jsp, php, ..).
Est-ce que quelqu'un aurait connaissance d'un mécanisme d'anti-template ?
càd l'on définirait des pages formées contenant des balises spécifiques destinées non pas à publier des infos dans des pages mais à récupérer des
infos dans des pages.
Merci de publier des pointeurs si cela existe
Tant pour expliquer que si qqun est interessé pour se lancer dedans, voici
un mini cdc Les parametres généraux à fournir seraient : * url de la page * reference du template à appliquer
et pour chaque balise: * nom du champs java / nom d'une étiquette permettant de récupérer l'info
par la suite * longueur min * longueur max
Merci de votre attention.
-- Jérôme B http://contrepeteries.free.fr (entrée libre, sortie gratuite, contributions
en décalages de sons bienvenues)
Oui, c'est ça
au lieu de HTMLenXSL + données en XML >--produit--> HTML avec les infos
dedans
on aurait :
HTML avec les infos dedans + HTML bis (semblable mais avec balises
spécifiques) >--produit--> objet Java ou fichier XML.
Jérôme B
http://contrepeteries.free.fr (entrée libre, sortie gratuite)
"Bruno Nogent" <bruno.nogent@metaxis.fr> a écrit dans le message de news:
cc0mlb$ahk$1@s1.read.news.oleane.net...
un genre de processeur xslt inverse en fait ?
"Jerome B" <jbaton_IdonTLike_SPAM@spam_spam_spam__oxymel.com> wrote in
message news:40e3d76b$0$10975$636a15ce@news.free.fr...
Bonjour,
Le principe de templates/modeles de documents est désormais très répandu
pour publier de l'information dynamique (jsp, php, ..).
Est-ce que quelqu'un aurait connaissance d'un mécanisme d'anti-template
?
càd l'on définirait des pages formées contenant des balises spécifiques
destinées non pas à publier des infos dans des pages mais à récupérer
des
infos dans des pages.
Merci de publier des pointeurs si cela existe
Tant pour expliquer que si qqun est interessé pour se lancer dedans,
voici
un mini cdc
Les parametres généraux à fournir seraient :
* url de la page
* reference du template à appliquer
et pour chaque balise:
* nom du champs java / nom d'une étiquette permettant de récupérer
l'info
par la suite
* longueur min
* longueur max
Merci de votre attention.
--
Jérôme B
http://contrepeteries.free.fr (entrée libre, sortie gratuite,
contributions
Oui, c'est ça au lieu de HTMLenXSL + données en XML >--produit--> HTML avec les infos dedans on aurait : HTML avec les infos dedans + HTML bis (semblable mais avec balises spécifiques) >--produit--> objet Java ou fichier XML.
Jérôme B http://contrepeteries.free.fr (entrée libre, sortie gratuite)
"Bruno Nogent" a écrit dans le message de news: cc0mlb$ahk$
un genre de processeur xslt inverse en fait ?
"Jerome B" wrote in message news:40e3d76b$0$10975$
Bonjour,
Le principe de templates/modeles de documents est désormais très répandu pour publier de l'information dynamique (jsp, php, ..).
Est-ce que quelqu'un aurait connaissance d'un mécanisme d'anti-template ?
càd l'on définirait des pages formées contenant des balises spécifiques destinées non pas à publier des infos dans des pages mais à récupérer des
infos dans des pages.
Merci de publier des pointeurs si cela existe
Tant pour expliquer que si qqun est interessé pour se lancer dedans, voici
un mini cdc Les parametres généraux à fournir seraient : * url de la page * reference du template à appliquer
et pour chaque balise: * nom du champs java / nom d'une étiquette permettant de récupérer l'info
par la suite * longueur min * longueur max
Merci de votre attention.
-- Jérôme B http://contrepeteries.free.fr (entrée libre, sortie gratuite, contributions
en décalages de sons bienvenues)
Carl
Bonjour,
Il me semble que c'est le boulot d'un parseur. Il en existe de nombreux sous java Xerces (apache) pour du XML qui doit pouvoir traiter du HTML ou bien un parseur HTML.
Une recherche google à "parseur java HTML" doit être instructive.
Carl
Jerome B wrote:
Oui, c'est ça au lieu de HTMLenXSL + données en XML >--produit--> HTML avec les infos dedans on aurait : HTML avec les infos dedans + HTML bis (semblable mais avec balises spécifiques) >--produit--> objet Java ou fichier XML.
Jérôme B http://contrepeteries.free.fr (entrée libre, sortie gratuite)
"Bruno Nogent" a écrit dans le message de news: cc0mlb$ahk$
un genre de processeur xslt inverse en fait ?
"Jerome B" wrote in message news:40e3d76b$0$10975$
Bonjour,
Le principe de templates/modeles de documents est désormais très répandu pour publier de l'information dynamique (jsp, php, ..).
Est-ce que quelqu'un aurait connaissance d'un mécanisme d'anti-template
?
càd l'on définirait des pages formées contenant des balises spécifiques destinées non pas à publier des infos dans des pages mais à récupérer
des
infos dans des pages.
Merci de publier des pointeurs si cela existe
Tant pour expliquer que si qqun est interessé pour se lancer dedans,
voici
un mini cdc Les parametres généraux à fournir seraient : * url de la page * reference du template à appliquer
et pour chaque balise: * nom du champs java / nom d'une étiquette permettant de récupérer
l'info
par la suite * longueur min * longueur max
Merci de votre attention.
-- Jérôme B http://contrepeteries.free.fr (entrée libre, sortie gratuite,
contributions
en décalages de sons bienvenues)
Bonjour,
Il me semble que c'est le boulot d'un parseur. Il en existe de nombreux
sous java Xerces (apache) pour du XML qui doit pouvoir traiter du HTML
ou bien un parseur HTML.
Une recherche google à "parseur java HTML" doit être instructive.
Carl
Jerome B wrote:
Oui, c'est ça
au lieu de HTMLenXSL + données en XML >--produit--> HTML avec les infos
dedans
on aurait :
HTML avec les infos dedans + HTML bis (semblable mais avec balises
spécifiques) >--produit--> objet Java ou fichier XML.
Jérôme B
http://contrepeteries.free.fr (entrée libre, sortie gratuite)
"Bruno Nogent" <bruno.nogent@metaxis.fr> a écrit dans le message de news:
cc0mlb$ahk$1@s1.read.news.oleane.net...
un genre de processeur xslt inverse en fait ?
"Jerome B" <jbaton_IdonTLike_SPAM@spam_spam_spam__oxymel.com> wrote in
message news:40e3d76b$0$10975$636a15ce@news.free.fr...
Bonjour,
Le principe de templates/modeles de documents est désormais très répandu
pour publier de l'information dynamique (jsp, php, ..).
Est-ce que quelqu'un aurait connaissance d'un mécanisme d'anti-template
?
càd l'on définirait des pages formées contenant des balises spécifiques
destinées non pas à publier des infos dans des pages mais à récupérer
des
infos dans des pages.
Merci de publier des pointeurs si cela existe
Tant pour expliquer que si qqun est interessé pour se lancer dedans,
voici
un mini cdc
Les parametres généraux à fournir seraient :
* url de la page
* reference du template à appliquer
et pour chaque balise:
* nom du champs java / nom d'une étiquette permettant de récupérer
l'info
par la suite
* longueur min
* longueur max
Merci de votre attention.
--
Jérôme B
http://contrepeteries.free.fr (entrée libre, sortie gratuite,
Il me semble que c'est le boulot d'un parseur. Il en existe de nombreux sous java Xerces (apache) pour du XML qui doit pouvoir traiter du HTML ou bien un parseur HTML.
Une recherche google à "parseur java HTML" doit être instructive.
Carl
Jerome B wrote:
Oui, c'est ça au lieu de HTMLenXSL + données en XML >--produit--> HTML avec les infos dedans on aurait : HTML avec les infos dedans + HTML bis (semblable mais avec balises spécifiques) >--produit--> objet Java ou fichier XML.
Jérôme B http://contrepeteries.free.fr (entrée libre, sortie gratuite)
"Bruno Nogent" a écrit dans le message de news: cc0mlb$ahk$
un genre de processeur xslt inverse en fait ?
"Jerome B" wrote in message news:40e3d76b$0$10975$
Bonjour,
Le principe de templates/modeles de documents est désormais très répandu pour publier de l'information dynamique (jsp, php, ..).
Est-ce que quelqu'un aurait connaissance d'un mécanisme d'anti-template
?
càd l'on définirait des pages formées contenant des balises spécifiques destinées non pas à publier des infos dans des pages mais à récupérer
des
infos dans des pages.
Merci de publier des pointeurs si cela existe
Tant pour expliquer que si qqun est interessé pour se lancer dedans,
voici
un mini cdc Les parametres généraux à fournir seraient : * url de la page * reference du template à appliquer
et pour chaque balise: * nom du champs java / nom d'une étiquette permettant de récupérer
l'info
par la suite * longueur min * longueur max
Merci de votre attention.
-- Jérôme B http://contrepeteries.free.fr (entrée libre, sortie gratuite,
contributions
en décalages de sons bienvenues)
Jerome B
Effectivement, c'est du parsage de html mais un peu plus que ça. Je ne cherche pas à parser le html, je veux la "couche au dessus", qui utilise le parser mais fournit le résultat directement. En fait, je cherche à utiliser les infos, pas à les récupérer.
L'idée, c'est de dupliquer la page type, de remplacer les infos par des balises spécifiques , de lancer un prog et zou, avoir les infos. S'il s'agit de tout monter en ram en arbre dom pour récupérer la 3e feuille de la 4e branche de la 6e branche de la racine, c'est pas très pratique (à peine plus qu'en sax pour ce cas là).
Je pensais que ce genre de prog devait forcement déja exister. C bien dommage.
Jérôme B http://contrepeteries.free.fr
"Carl" a écrit dans le message de news: cc0o47$edu$
Bonjour,
Il me semble que c'est le boulot d'un parseur. Il en existe de nombreux sous java Xerces (apache) pour du XML qui doit pouvoir traiter du HTML ou bien un parseur HTML.
Une recherche google à "parseur java HTML" doit être instructive.
Carl
Jerome B wrote:
Oui, c'est ça au lieu de HTMLenXSL + données en XML >--produit--> HTML avec les infos dedans on aurait : HTML avec les infos dedans + HTML bis (semblable mais avec balises spécifiques) >--produit--> objet Java ou fichier XML.
Jérôme B http://contrepeteries.free.fr (entrée libre, sortie gratuite)
"Bruno Nogent" a écrit dans le message de news:
cc0mlb$ahk$
un genre de processeur xslt inverse en fait ?
"Jerome B" wrote in message news:40e3d76b$0$10975$
Bonjour,
Le principe de templates/modeles de documents est désormais très répandu
pour publier de l'information dynamique (jsp, php, ..).
Est-ce que quelqu'un aurait connaissance d'un mécanisme d'anti-template
?
càd l'on définirait des pages formées contenant des balises spécifiques destinées non pas à publier des infos dans des pages mais à récupérer
des
infos dans des pages.
Merci de publier des pointeurs si cela existe
Tant pour expliquer que si qqun est interessé pour se lancer dedans,
voici
un mini cdc Les parametres généraux à fournir seraient : * url de la page * reference du template à appliquer
et pour chaque balise: * nom du champs java / nom d'une étiquette permettant de récupérer
l'info
par la suite * longueur min * longueur max
Merci de votre attention.
-- Jérôme B http://contrepeteries.free.fr (entrée libre, sortie gratuite,
contributions
en décalages de sons bienvenues)
Effectivement, c'est du parsage de html mais un peu plus que ça.
Je ne cherche pas à parser le html, je veux la "couche au dessus", qui
utilise le parser mais fournit le résultat directement. En fait, je cherche
à utiliser les infos, pas à les récupérer.
L'idée, c'est de dupliquer la page type, de remplacer les infos par des
balises spécifiques , de lancer un prog et zou, avoir les infos.
S'il s'agit de tout monter en ram en arbre dom pour récupérer la 3e feuille
de la 4e branche de la 6e branche de la racine, c'est pas très pratique (à
peine plus qu'en sax pour ce cas là).
Je pensais que ce genre de prog devait forcement déja exister. C bien
dommage.
Jérôme B
http://contrepeteries.free.fr
"Carl" <multivac@altern.org> a écrit dans le message de news:
cc0o47$edu$1@news-reader1.wanadoo.fr...
Bonjour,
Il me semble que c'est le boulot d'un parseur. Il en existe de nombreux
sous java Xerces (apache) pour du XML qui doit pouvoir traiter du HTML
ou bien un parseur HTML.
Une recherche google à "parseur java HTML" doit être instructive.
Carl
Jerome B wrote:
Oui, c'est ça
au lieu de HTMLenXSL + données en XML >--produit--> HTML avec les infos
dedans
on aurait :
HTML avec les infos dedans + HTML bis (semblable mais avec balises
spécifiques) >--produit--> objet Java ou fichier XML.
Jérôme B
http://contrepeteries.free.fr (entrée libre, sortie gratuite)
"Bruno Nogent" <bruno.nogent@metaxis.fr> a écrit dans le message de
news:
cc0mlb$ahk$1@s1.read.news.oleane.net...
un genre de processeur xslt inverse en fait ?
"Jerome B" <jbaton_IdonTLike_SPAM@spam_spam_spam__oxymel.com> wrote in
message news:40e3d76b$0$10975$636a15ce@news.free.fr...
Bonjour,
Le principe de templates/modeles de documents est désormais très
répandu
pour publier de l'information dynamique (jsp, php, ..).
Est-ce que quelqu'un aurait connaissance d'un mécanisme d'anti-template
?
càd l'on définirait des pages formées contenant des balises spécifiques
destinées non pas à publier des infos dans des pages mais à récupérer
des
infos dans des pages.
Merci de publier des pointeurs si cela existe
Tant pour expliquer que si qqun est interessé pour se lancer dedans,
voici
un mini cdc
Les parametres généraux à fournir seraient :
* url de la page
* reference du template à appliquer
et pour chaque balise:
* nom du champs java / nom d'une étiquette permettant de récupérer
l'info
par la suite
* longueur min
* longueur max
Merci de votre attention.
--
Jérôme B
http://contrepeteries.free.fr (entrée libre, sortie gratuite,
Effectivement, c'est du parsage de html mais un peu plus que ça. Je ne cherche pas à parser le html, je veux la "couche au dessus", qui utilise le parser mais fournit le résultat directement. En fait, je cherche à utiliser les infos, pas à les récupérer.
L'idée, c'est de dupliquer la page type, de remplacer les infos par des balises spécifiques , de lancer un prog et zou, avoir les infos. S'il s'agit de tout monter en ram en arbre dom pour récupérer la 3e feuille de la 4e branche de la 6e branche de la racine, c'est pas très pratique (à peine plus qu'en sax pour ce cas là).
Je pensais que ce genre de prog devait forcement déja exister. C bien dommage.
Jérôme B http://contrepeteries.free.fr
"Carl" a écrit dans le message de news: cc0o47$edu$
Bonjour,
Il me semble que c'est le boulot d'un parseur. Il en existe de nombreux sous java Xerces (apache) pour du XML qui doit pouvoir traiter du HTML ou bien un parseur HTML.
Une recherche google à "parseur java HTML" doit être instructive.
Carl
Jerome B wrote:
Oui, c'est ça au lieu de HTMLenXSL + données en XML >--produit--> HTML avec les infos dedans on aurait : HTML avec les infos dedans + HTML bis (semblable mais avec balises spécifiques) >--produit--> objet Java ou fichier XML.
Jérôme B http://contrepeteries.free.fr (entrée libre, sortie gratuite)
"Bruno Nogent" a écrit dans le message de news:
cc0mlb$ahk$
un genre de processeur xslt inverse en fait ?
"Jerome B" wrote in message news:40e3d76b$0$10975$
Bonjour,
Le principe de templates/modeles de documents est désormais très répandu
pour publier de l'information dynamique (jsp, php, ..).
Est-ce que quelqu'un aurait connaissance d'un mécanisme d'anti-template
?
càd l'on définirait des pages formées contenant des balises spécifiques destinées non pas à publier des infos dans des pages mais à récupérer
des
infos dans des pages.
Merci de publier des pointeurs si cela existe
Tant pour expliquer que si qqun est interessé pour se lancer dedans,
voici
un mini cdc Les parametres généraux à fournir seraient : * url de la page * reference du template à appliquer
et pour chaque balise: * nom du champs java / nom d'une étiquette permettant de récupérer
l'info
par la suite * longueur min * longueur max
Merci de votre attention.
-- Jérôme B http://contrepeteries.free.fr (entrée libre, sortie gratuite,
contributions
en décalages de sons bienvenues)
Bruno Nogent
je crois qu'il y a qqchose de comme ca dans le portail de sybase.. peut etre dand d'autres portails egalement..... du pillage de site html !
"Jerome B" wrote in message news:40e405c0$0$10975$
Effectivement, c'est du parsage de html mais un peu plus que ça. Je ne cherche pas à parser le html, je veux la "couche au dessus", qui utilise le parser mais fournit le résultat directement. En fait, je cherche
à utiliser les infos, pas à les récupérer.
L'idée, c'est de dupliquer la page type, de remplacer les infos par des balises spécifiques , de lancer un prog et zou, avoir les infos. S'il s'agit de tout monter en ram en arbre dom pour récupérer la 3e feuille
de la 4e branche de la 6e branche de la racine, c'est pas très pratique (à peine plus qu'en sax pour ce cas là).
Je pensais que ce genre de prog devait forcement déja exister. C bien dommage.
Jérôme B http://contrepeteries.free.fr
"Carl" a écrit dans le message de news: cc0o47$edu$
Bonjour,
Il me semble que c'est le boulot d'un parseur. Il en existe de nombreux sous java Xerces (apache) pour du XML qui doit pouvoir traiter du HTML ou bien un parseur HTML.
Une recherche google à "parseur java HTML" doit être instructive.
Carl
Jerome B wrote:
Oui, c'est ça au lieu de HTMLenXSL + données en XML >--produit--> HTML avec les infos
dedans on aurait : HTML avec les infos dedans + HTML bis (semblable mais avec balises spécifiques) >--produit--> objet Java ou fichier XML.
Jérôme B http://contrepeteries.free.fr (entrée libre, sortie gratuite)
"Bruno Nogent" a écrit dans le message de news:
cc0mlb$ahk$
un genre de processeur xslt inverse en fait ?
"Jerome B" wrote in message news:40e3d76b$0$10975$
Bonjour,
Le principe de templates/modeles de documents est désormais très répandu
pour publier de l'information dynamique (jsp, php, ..).
Est-ce que quelqu'un aurait connaissance d'un mécanisme d'anti-template
?
càd l'on définirait des pages formées contenant des balises spécifiques
destinées non pas à publier des infos dans des pages mais à récupérer
des
infos dans des pages.
Merci de publier des pointeurs si cela existe
Tant pour expliquer que si qqun est interessé pour se lancer dedans,
voici
un mini cdc Les parametres généraux à fournir seraient : * url de la page * reference du template à appliquer
et pour chaque balise: * nom du champs java / nom d'une étiquette permettant de récupérer
l'info
par la suite * longueur min * longueur max
Merci de votre attention.
-- Jérôme B http://contrepeteries.free.fr (entrée libre, sortie gratuite,
contributions
en décalages de sons bienvenues)
je crois qu'il y a qqchose de comme ca dans le portail de sybase.. peut etre
dand d'autres portails egalement.....
du pillage de site html !
"Jerome B" <jbaton_IdonTLike_SPAM@spam_spam_spam__oxymel.com> wrote in
message news:40e405c0$0$10975$636a15ce@news.free.fr...
Effectivement, c'est du parsage de html mais un peu plus que ça.
Je ne cherche pas à parser le html, je veux la "couche au dessus", qui
utilise le parser mais fournit le résultat directement. En fait, je
cherche
à utiliser les infos, pas à les récupérer.
L'idée, c'est de dupliquer la page type, de remplacer les infos par des
balises spécifiques , de lancer un prog et zou, avoir les infos.
S'il s'agit de tout monter en ram en arbre dom pour récupérer la 3e
feuille
de la 4e branche de la 6e branche de la racine, c'est pas très pratique (à
peine plus qu'en sax pour ce cas là).
Je pensais que ce genre de prog devait forcement déja exister. C bien
dommage.
Jérôme B
http://contrepeteries.free.fr
"Carl" <multivac@altern.org> a écrit dans le message de news:
cc0o47$edu$1@news-reader1.wanadoo.fr...
Bonjour,
Il me semble que c'est le boulot d'un parseur. Il en existe de nombreux
sous java Xerces (apache) pour du XML qui doit pouvoir traiter du HTML
ou bien un parseur HTML.
Une recherche google à "parseur java HTML" doit être instructive.
Carl
Jerome B wrote:
Oui, c'est ça
au lieu de HTMLenXSL + données en XML >--produit--> HTML avec les
infos
dedans
on aurait :
HTML avec les infos dedans + HTML bis (semblable mais avec balises
spécifiques) >--produit--> objet Java ou fichier XML.
Jérôme B
http://contrepeteries.free.fr (entrée libre, sortie gratuite)
"Bruno Nogent" <bruno.nogent@metaxis.fr> a écrit dans le message de
news:
cc0mlb$ahk$1@s1.read.news.oleane.net...
un genre de processeur xslt inverse en fait ?
"Jerome B" <jbaton_IdonTLike_SPAM@spam_spam_spam__oxymel.com> wrote in
message news:40e3d76b$0$10975$636a15ce@news.free.fr...
Bonjour,
Le principe de templates/modeles de documents est désormais très
répandu
pour publier de l'information dynamique (jsp, php, ..).
Est-ce que quelqu'un aurait connaissance d'un mécanisme
d'anti-template
?
càd l'on définirait des pages formées contenant des balises
spécifiques
destinées non pas à publier des infos dans des pages mais à récupérer
des
infos dans des pages.
Merci de publier des pointeurs si cela existe
Tant pour expliquer que si qqun est interessé pour se lancer dedans,
voici
un mini cdc
Les parametres généraux à fournir seraient :
* url de la page
* reference du template à appliquer
et pour chaque balise:
* nom du champs java / nom d'une étiquette permettant de récupérer
l'info
par la suite
* longueur min
* longueur max
Merci de votre attention.
--
Jérôme B
http://contrepeteries.free.fr (entrée libre, sortie gratuite,
je crois qu'il y a qqchose de comme ca dans le portail de sybase.. peut etre dand d'autres portails egalement..... du pillage de site html !
"Jerome B" wrote in message news:40e405c0$0$10975$
Effectivement, c'est du parsage de html mais un peu plus que ça. Je ne cherche pas à parser le html, je veux la "couche au dessus", qui utilise le parser mais fournit le résultat directement. En fait, je cherche
à utiliser les infos, pas à les récupérer.
L'idée, c'est de dupliquer la page type, de remplacer les infos par des balises spécifiques , de lancer un prog et zou, avoir les infos. S'il s'agit de tout monter en ram en arbre dom pour récupérer la 3e feuille
de la 4e branche de la 6e branche de la racine, c'est pas très pratique (à peine plus qu'en sax pour ce cas là).
Je pensais que ce genre de prog devait forcement déja exister. C bien dommage.
Jérôme B http://contrepeteries.free.fr
"Carl" a écrit dans le message de news: cc0o47$edu$
Bonjour,
Il me semble que c'est le boulot d'un parseur. Il en existe de nombreux sous java Xerces (apache) pour du XML qui doit pouvoir traiter du HTML ou bien un parseur HTML.
Une recherche google à "parseur java HTML" doit être instructive.
Carl
Jerome B wrote:
Oui, c'est ça au lieu de HTMLenXSL + données en XML >--produit--> HTML avec les infos
dedans on aurait : HTML avec les infos dedans + HTML bis (semblable mais avec balises spécifiques) >--produit--> objet Java ou fichier XML.
Jérôme B http://contrepeteries.free.fr (entrée libre, sortie gratuite)
"Bruno Nogent" a écrit dans le message de news:
cc0mlb$ahk$
un genre de processeur xslt inverse en fait ?
"Jerome B" wrote in message news:40e3d76b$0$10975$
Bonjour,
Le principe de templates/modeles de documents est désormais très répandu
pour publier de l'information dynamique (jsp, php, ..).
Est-ce que quelqu'un aurait connaissance d'un mécanisme d'anti-template
?
càd l'on définirait des pages formées contenant des balises spécifiques
destinées non pas à publier des infos dans des pages mais à récupérer
des
infos dans des pages.
Merci de publier des pointeurs si cela existe
Tant pour expliquer que si qqun est interessé pour se lancer dedans,
voici
un mini cdc Les parametres généraux à fournir seraient : * url de la page * reference du template à appliquer
et pour chaque balise: * nom du champs java / nom d'une étiquette permettant de récupérer
l'info
par la suite * longueur min * longueur max
Merci de votre attention.
-- Jérôme B http://contrepeteries.free.fr (entrée libre, sortie gratuite,