Hypertexte Integral

Le
Lez
Bonjour,

pour un projet personnel, je voudrais générer des pages de texte en
"hypertexte integral", c'est à dire avec un lien deriere chaque mot
propre à ce mot.
Mais je voudrais trouver un moyen plus pratique que de placer "à la
main" une balise <a> pour chaque mot. Je suis sous windows, avec de
vagues souvenirs de programmation en shell Unix, donc je pense qu'en
bossant un peu, je pourrais écrire une routine type awk (enfin, avec un
portage sous win de awk)qui remplace chaque chaîne de caractère entre
deux espaces ou entre un espace et un signe de ponctuation par la même
chaîne encadrée par la balise <a> vers un fichier html nommé d'après la
chaîne. Mais je voudrais gérer intelligement flexions de verbes,
pluriels et féminins (le la les renvoient à le.html, fait faites
faisions à faire.html, beau belle à beau.html etc.).
Je crois (mais je ne suis pas sûr) que je pourrais developper une autre
routine qui prenne tous les mots d'un fichier texte et me demande le nom
du lien puis produise un fichier html, ce serait déjà pas mal. Ce que je
ne saurais pas faire, c'est donner un peu d'intelligence au truc et lui
faire me proposer des liens probables.
Je me dis aussi qu'il doit y avoir d'autres solutions que la balise <a>,
mais je ne m'y connais pas assez.
Voilà, s'il y a des gens que le problème amuse et qui sont
désinteressés, je suis ouvert à toutes les propositions et suggestions

Lez
Questions / Réponses high-tech
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Mickaël Wolff
Le #22072141
Lez a écrit :
Bonjour,

pour un projet personnel, je voudrais générer des pages de texte en
"hypertexte integral", c'est à dire avec un lien deriere chaque mot
propre à ce mot.




Mais je voudrais trouver un moyen plus pratique que de placer "à la
main" une balise <a> pour chaque mot. Je suis sous windows, avec de
vagues souvenirs de programmation en shell Unix, donc je pense qu'en
bossant un peu, je pourrais écrire une routine type awk (enfin, avec un
portage sous win de awk)



Microsoft Services For Unix et Cygwin proposent des environnement Unix.

qui remplace chaque chaîne de caractère entre
deux espaces ou entre un espace et un signe de ponctuation par la même
chaîne encadrée par la balise <a> vers un fichier html nommé d'après la
chaîne.



Bête et méchant, avec le super éditeur, on peut déjà proposé ceci
pour dégrossir :

export texte=mon_fichier.txt
sed -i "s/&/&amp;/g" $texte
sed -i "s/</&lt;/g" $texte
sed -i "s/>/&gt;/g" $texte
sed -i "s/b(w*)b/

Mais je voudrais gérer intelligement flexions de verbes,
pluriels et féminins (le la les renvoient à le.html, fait faites
faisions à faire.html, beau belle à beau.html etc.).



Là ça va être un peu moins simple. Il faudra certainement disposer
d'un dictionnaire de référence, avec toutes les flexions et un moyen de
déterminer si un mot est effectivement dans une forme d'un autre mot. Ça
demande un algo un peu élaboré à mon avis.

Je crois (mais je ne suis pas sûr) que je pourrais developper une autre
routine qui prenne tous les mots d'un fichier texte et me demande le nom
du lien puis produise un fichier html, ce serait déjà pas mal. Ce que je
ne saurais pas faire, c'est donner un peu d'intelligence au truc et lui
faire me proposer des liens probables.



Ça risque de devenir pénible à gérer si tu gères à partir d'un
fichier texte. Essaye de chercher des bases de données
grammaticales/orthographiques.

Je me dis aussi qu'il doit y avoir d'autres solutions que la balise <a>,
mais je ne m'y connais pas assez.



Ben moi je n'en vois pas l'intérêt, de ce casser la tête pour
seulement proposer des liens sur chaque mot. Le lien hypertexte est
intéressant lorsqu'il est pertinent.

Remarque il y a une autre possibilité, mais c'est en javascript. Ce
serait d'ouvrir une popup ou une iframe sur le double-clique d'un mot.
Ainsi tu éviterais de surcharger le HTML de toutes ces ancres.

Mais j'aimerais savoir à quoi ça va te servir ;)
--
Mickaël Wolff aka Lupus Michaelis
http://lupusmic.org
Olivier Miakinen
Le #22072131
Le 28/07/2008 00:05, Mickaël Wolff répondait à Lez :

Je me dis aussi qu'il doit y avoir d'autres solutions que la balise <a>,
mais je ne m'y connais pas assez.



Ben moi je n'en vois pas l'intérêt, de ce casser la tête pour
seulement proposer des liens sur chaque mot. Le lien hypertexte est
intéressant lorsqu'il est pertinent.



Entièrement d'accord.

Remarque il y a une autre possibilité, mais c'est en javascript. Ce
serait d'ouvrir une popup ou une iframe sur le double-clique d'un mot.
Ainsi tu éviterais de surcharger le HTML de toutes ces ancres.

Mais j'aimerais savoir à quoi ça va te servir ;)



Le TLFi Il ouvre une popup à chaque fois que tu sélectionnes un texte, ce qui
fait donc plus que ce que propose Mickaël puisque double-cliquer sur un
mot sélectionne généralement ce mot (du moins dans les navigateurs que
je connais). C'en est même pénible quand on veut juste copier-coller un
bout de texte.

En tout cas, Lez, tu peux déjà voir ce que ça donne et si tu veux t'en
inspirer.

Cordialement,
--
Olivier Miakinen
Lez
Le #22072121
Par manque de temps ce matin, je réponds au deux (Mickaël et Olivier.

C'est pour un projet de type ... littéraire (désolé), un petit labo pour
m'amuser. Disons que je voudrais produire un texte 100% autoréférentiel.
Mais pas tout à fait.

Mickaël, t'as tout compris, pour ce qui est de la nature des liens, et
oui, ce serait bien d'avoir un dico de référence à interfacer dans mon
petit labo.

Olivier, merci pour le TLFI, je n'y avais pas pensé ou je l'avais
oublié. Vu le code, il y a un .exe qui renvoie à _top au doubleclick,
donc on peut imaginer qu'il puisse renvoyer sur la page courante.

Merci à tous les deux.

L.
Pierre Goiffon
Le #22072101
Olivier Miakinen wrote:
Je me dis aussi qu'il doit y avoir d'autres solutions que la balise <a>,
mais je ne m'y connais pas assez.


Ben moi je n'en vois pas l'intérêt, de ce casser la tête pour
seulement proposer des liens sur chaque mot. Le lien hypertexte est
intéressant lorsqu'il est pertinent.



Entièrement d'accord.



Idem :) mais des précisions ont été apportées par la suite sur le
contexte de la réalisation...

Remarque il y a une autre possibilité, mais c'est en javascript. Ce
serait d'ouvrir une popup ou une iframe sur le double-clique d'un mot.
Ainsi tu éviterais de surcharger le HTML de toutes ces ancres.



Le TLFi


Moi à vue de nez je verrai un bout de JavaScript qui insère
dynamiquement les liens en se basant sur un dictionnaire. Ce
dictionnaire pourrait être directement le TLFi par exemple avec un appel
par XHR (si mot trouvé, je crée un lien vers la fiche correspondante)
Lez
Le #22072031
Pierre Goiffon a écrit :

Moi à vue de nez je verrai un bout de JavaScript qui insère
dynamiquement les liens en se basant sur un dictionnaire. Ce
dictionnaire pourrait être directement le TLFi par exemple avec un appel
par XHR (si mot trouvé, je crée un lien vers la fiche correspondante)



Ca dépasse d'assez loin ce que je sais faire, mais si je comprends bien
ça consiste pour chaque mot cliqué à consulter le TLFI (ou une autre
base de référence) pour savoir de quel mot M il est la #flexion (pour
aller vite)et de générer ensuite dynamiquement un lien vers M.html de
mon site ? C'est une très jolie manip, qui pourrait être d'une grande
utilité.

Ceci dit, pour le chantier que j'ai en tête, ça ne ferait pas l'affaire,
et je me rends compte grâce à ta suggestion d'autres contraintes. En
fait, je pense avoir BESOIN que les liens soient en dur dans les
fichiers, car cela me parait être finalement le moyen le plus simple de
vérifier la complétude du projet via un gestionnaire de site : le projet
est fini le jour où tous les liens pointent vers une page et où au moins
un lien pointe vers chaque page.

Par ailleurs, il faudrait embarquer un joli paquet d'intelligence ou
gérer avec une patience de bénédictin les exceptions pour décider de
brancher "fait" sur "fait" ou sur "faire", par exemple.

Bon, je vous doit à tous des excuses, car en cherchant, depuis le
boulot, ce thread sur groups.google, je me suis aperçu que j'avais déjà
posté sur le même sujet il y a trois ans (et dans le même groupe !), et
oublié les réponses (qui suggéraient déjà le TLFI). C'est pas très
élégant, j'en ai peur. Mais c'est ce genre d'idées qui vous trottent par
la tête et qui mettent si longtemps à mûrir qu'on en oublie parfois les
étapes intermédiaires.

Excuses tout particulièrement à Olivier qui avait déjà participé au
premier thread.

L.
Olivier Miakinen
Le #22072021
Le 29/07/2008 09:10, Lez a écrit :

[...]

Bon, je vous doit à tous des excuses, car en cherchant, depuis le
boulot, ce thread sur groups.google, je me suis aperçu que j'avais déjà
posté sur le même sujet il y a trois ans (et dans le même groupe !), et
oublié les réponses (qui suggéraient déjà le TLFI). C'est pas très
élégant, j'en ai peur. Mais c'est ce genre d'idées qui vous trottent par
la tête et qui mettent si longtemps à mûrir qu'on en oublie parfois les
étapes intermédiaires.

Excuses tout particulièrement à Olivier qui avait déjà participé au
premier thread.



Aucune offense, d'autant que je l'avais moi-même oublié. ;-)
Publicité
Poster une réponse
Anonyme