Bonjour,
après moult recherches infructueuses sur le net, je recherche une
fonction PHP qui :
- recherche (ou indexe) des mots ou du texte dans des fichiers HTML
(jusque là ça va :-),
- ne cherche pas dans les parties javascript ou css
- ne cherche pas à l'intérieur des balises,
sauf l'attribut alt de < img src=....
sauf les mots clés de <META NAME="Keywords" content=
sauf le texte à l'intérieur de <title>...</title>
- et enfin arrive à trouver les mots (saisis ou dans les pages html
cherchées) quand les minuscules accentuées sont codées ou non, par exemple :
détaillé
et
détaillé
Merci, mais je connaissais. J'ai regardé toutes ces fonctions, aucune ne fait de traitement "sophistiqué" des balises comme ce que je cherche (ou alors il faut que je change de lunettes :-) En plus, celles qui traitent les balises considèrent toutes que la balise de début et celle de fin sont sur la même ligne : ils font un fgets() jusqu'à la fin du fichier et pour chaque ligne ils cherchent <title>...</title> pour les plus évolués. C'est loin de correspondre à ce que je cherche. Par contre ça correspond à ce que je savais déjà faire tout seul :-)) Des expressions régulières bien codées devraient faire le travail, mais là je suis un nul ! C'est surtout le fait qu'une balise ou sa fermeture ou ce qu'il y a entre les 2 puisse être sur plusieurs lignes qui est compliqué pour moi !
Merci, mais je connaissais.
J'ai regardé toutes ces fonctions, aucune ne fait de traitement
"sophistiqué" des balises comme ce que je cherche (ou alors il faut que
je change de lunettes :-)
En plus, celles qui traitent les balises considèrent toutes que la
balise de début et celle de fin sont sur la même ligne :
ils font un fgets() jusqu'à la fin du fichier et pour chaque ligne ils
cherchent <title>...</title> pour les plus évolués.
C'est loin de correspondre à ce que je cherche. Par contre ça correspond
à ce que je savais déjà faire tout seul :-))
Des expressions régulières bien codées devraient faire le travail, mais
là je suis un nul !
C'est surtout le fait qu'une balise ou sa fermeture ou ce qu'il y a
entre les 2 puisse être sur plusieurs lignes qui est compliqué pour moi !
Merci, mais je connaissais. J'ai regardé toutes ces fonctions, aucune ne fait de traitement "sophistiqué" des balises comme ce que je cherche (ou alors il faut que je change de lunettes :-) En plus, celles qui traitent les balises considèrent toutes que la balise de début et celle de fin sont sur la même ligne : ils font un fgets() jusqu'à la fin du fichier et pour chaque ligne ils cherchent <title>...</title> pour les plus évolués. C'est loin de correspondre à ce que je cherche. Par contre ça correspond à ce que je savais déjà faire tout seul :-)) Des expressions régulières bien codées devraient faire le travail, mais là je suis un nul ! C'est surtout le fait qu'une balise ou sa fermeture ou ce qu'il y a entre les 2 puisse être sur plusieurs lignes qui est compliqué pour moi !