Dédoublonnage

Le
Hamet
Bonsoir

Je cherche une méthode efficace pour dédoublonner des fichiers clients. Je
travaille avec sqlserver2005. j'ai entendu parler de la fonction soundex.
cependant je ne trouve pas d'exemple d'utilisation de cette fonction.
Avez-vous un exemple ou connaissez-vous une autre méthode (composant SSIS)
?

Merci

Hamet
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Patrice
Le #11866901
Voir :
http://technet.microsoft.com/fr-fr/library/ms189282.aspx

Après aucun idée de ce que cela vaut

J'avais vu aussi un algo intéressant qui calcule la "editing distance" (le
nombre d'opérations d'éditions qu'il faut pour passer d'une chaîne à
l'autre)

Ah ca y est. Merci Google. C'est la distance de Levenhstein.

--
Patrice

"Hamet"
Bonsoir

Je cherche une méthode efficace pour dédoublonner des fichiers clients. Je
travaille avec sqlserver2005. j'ai entendu parler de la fonction soundex.
cependant je ne trouve pas d'exemple d'utilisation de cette fonction.
Avez-vous un exemple ou connaissez-vous une autre méthode (composant
SSIS...)
?

Merci

Hamet


Fred BROUARD
Le #11866851
Patrice a écrit :
Voir :
http://technet.microsoft.com/fr-fr/library/ms189282.aspx

Après aucun idée de ce que cela vaut

J'avais vu aussi un algo intéressant qui calcule la "editing distance" (le
nombre d'opérations d'éditions qu'il faut pour passer d'une chaîne à
l'autre)

Ah ca y est. Merci Google. C'est la distance de Levenhstein.



Levenshtein ou hamming ou encore bien d'autres... Mais anntention au
coût !!!
En effet le coût du levenshtein est exponentiel.

Lisez l'article que j'ai écrit sur les doublons
http://sqlpro.developpez.com/cours/doublons/

A +


--
Patrice

"Hamet"
Bonsoir

Je cherche une méthode efficace pour dédoublonner des fichiers clients. Je
travaille avec sqlserver2005. j'ai entendu parler de la fonction soundex.
cependant je ne trouve pas d'exemple d'utilisation de cette fonction.
Avez-vous un exemple ou connaissez-vous une autre méthode (composant
SSIS...)
?

Merci

Hamet








--
Frédéric BROUARD, MVP SQL Server, expert bases de données et langage SQL
Le site sur le langage SQL et les SGBDR : http://sqlpro.developpez.com
Audit, conseil, expertise, formation, modélisation, tuning, optimisation
*********************** http://www.sqlspot.com *************************
Publicité
Poster une réponse
Anonyme