Un peu bizzare, je pourrais restraindre à 3 caractères et ce serait mieux.
Quand pensez-vous?
--
Moustique
La souplesse d'esprit permet de s'adapter dans toutes circonstances.
www.velo-passion.com pour les fans de vélo
http://www.lapassade.ch pour les fans de théâtre
http://www.lorimier.com/expo02 pour les nostalgiques d'un super événement
Cette action est irreversible, confirmez la suppression du commentaire ?
Signaler le commentaire
Veuillez sélectionner un problème
Nudité
Violence
Harcèlement
Fraude
Vente illégale
Discours haineux
Terrorisme
Autre
P'tit Marcel
Moustique écrivit:
J'ai fait des tests avec des noms propres: Soundex à gauche et le nom à droite
1°) il faudrait tester avec des mots français et non avec des noms propres 2°) Le SOUNDex s'évalue de façon sonore et non par écrit. ça n'a d'intérêt que si le mot a été dicté (ex: commande par téléphone). 3°) l'algo de Soundex est simpliste plus que pertinent.
a112 Acherli non, correspond à acrl donc devrait faire a264
a112 Agra idem équivalent à agr soit a76
bref il y a une c. dans le script (voir plus bas!)
Que pensez-vous de la fonction soundex français sur nexen? http://dev.nexen.net/scripts/details.php?scripts)4
défauts conceptuels (mais pas propre à ce script) : - impasse sur les voyelles (or le français n'est pas l'hébreu) - impasse sur le h (pas focéement muet) et sur le w (algo de Ouallon ;-) - impasse sur les lettres liées différentes (ph, ch, qu, mn, etc.) - x, z et s sont considérés interchangeables - manque un contrôle que le mot n'a que des lettres a..z non accentuées En définitive, l'algo devait travailler par phonème et non par lettre.
sur le plan programmation : - il y a un 'print' qui n'a rien à faire là - l'instruction cruciale est fausse (ordre et taille des paramètres). il faudrait probablement : strtr(substr($chaine,1),'bpckqdtlmnrgjxzsfv','112223345567788899'); au lieu de strtr("1122233455677888999", "bpckqdtlmnrgjxzsfv", $chaine);
-- P'tit Marcel
Moustique écrivit:
J'ai fait des tests avec des noms propres:
Soundex à gauche et le nom à droite
1°) il faudrait tester avec des mots français et non avec des noms propres
2°) Le SOUNDex s'évalue de façon sonore et non par écrit. ça n'a d'intérêt
que si le mot a été dicté (ex: commande par téléphone).
3°) l'algo de Soundex est simpliste plus que pertinent.
a112 Acherli
non, correspond à acrl donc devrait faire a264
a112 Agra
idem équivalent à agr soit a76
bref il y a une c. dans le script (voir plus bas!)
Que pensez-vous de la fonction soundex français sur nexen?
http://dev.nexen.net/scripts/details.php?scripts)4
défauts conceptuels (mais pas propre à ce script) :
- impasse sur les voyelles (or le français n'est pas l'hébreu)
- impasse sur le h (pas focéement muet) et sur le w (algo de Ouallon ;-)
- impasse sur les lettres liées différentes (ph, ch, qu, mn, etc.)
- x, z et s sont considérés interchangeables
- manque un contrôle que le mot n'a que des lettres a..z non accentuées
En définitive, l'algo devait travailler par phonème et non par lettre.
sur le plan programmation :
- il y a un 'print' qui n'a rien à faire là
- l'instruction cruciale est fausse (ordre et taille des paramètres).
il faudrait probablement :
strtr(substr($chaine,1),'bpckqdtlmnrgjxzsfv','112223345567788899');
au lieu de
strtr("1122233455677888999", "bpckqdtlmnrgjxzsfv", $chaine);
J'ai fait des tests avec des noms propres: Soundex à gauche et le nom à droite
1°) il faudrait tester avec des mots français et non avec des noms propres 2°) Le SOUNDex s'évalue de façon sonore et non par écrit. ça n'a d'intérêt que si le mot a été dicté (ex: commande par téléphone). 3°) l'algo de Soundex est simpliste plus que pertinent.
a112 Acherli non, correspond à acrl donc devrait faire a264
a112 Agra idem équivalent à agr soit a76
bref il y a une c. dans le script (voir plus bas!)
Que pensez-vous de la fonction soundex français sur nexen? http://dev.nexen.net/scripts/details.php?scripts)4
défauts conceptuels (mais pas propre à ce script) : - impasse sur les voyelles (or le français n'est pas l'hébreu) - impasse sur le h (pas focéement muet) et sur le w (algo de Ouallon ;-) - impasse sur les lettres liées différentes (ph, ch, qu, mn, etc.) - x, z et s sont considérés interchangeables - manque un contrôle que le mot n'a que des lettres a..z non accentuées En définitive, l'algo devait travailler par phonème et non par lettre.
sur le plan programmation : - il y a un 'print' qui n'a rien à faire là - l'instruction cruciale est fausse (ordre et taille des paramètres). il faudrait probablement : strtr(substr($chaine,1),'bpckqdtlmnrgjxzsfv','112223345567788899'); au lieu de strtr("1122233455677888999", "bpckqdtlmnrgjxzsfv", $chaine);