Je cherche une méthode efficace pour dédoublonner des fichiers clients. Je
travaille avec sqlserver2005. j'ai entendu parler de la fonction soundex.
cependant je ne trouve pas d'exemple d'utilisation de cette fonction.
Avez-vous un exemple ou connaissez-vous une autre méthode (composant SSIS...)
?
J'avais vu aussi un algo intéressant qui calcule la "editing distance" (le nombre d'opérations d'éditions qu'il faut pour passer d'une chaîne à l'autre)
Ah ca y est. Merci Google. C'est la distance de Levenhstein.
-- Patrice
"Hamet" a écrit dans le message de news:
Bonsoir
Je cherche une méthode efficace pour dédoublonner des fichiers clients. Je travaille avec sqlserver2005. j'ai entendu parler de la fonction soundex. cependant je ne trouve pas d'exemple d'utilisation de cette fonction. Avez-vous un exemple ou connaissez-vous une autre méthode (composant SSIS...) ?
J'avais vu aussi un algo intéressant qui calcule la "editing distance" (le
nombre d'opérations d'éditions qu'il faut pour passer d'une chaîne à
l'autre)
Ah ca y est. Merci Google. C'est la distance de Levenhstein.
--
Patrice
"Hamet" <Hamet@discussions.microsoft.com> a écrit dans le message de news:
30EF4BDA-E0EC-4CD4-BAB3-11E28ACAED20@microsoft.com...
Bonsoir
Je cherche une méthode efficace pour dédoublonner des fichiers clients. Je
travaille avec sqlserver2005. j'ai entendu parler de la fonction soundex.
cependant je ne trouve pas d'exemple d'utilisation de cette fonction.
Avez-vous un exemple ou connaissez-vous une autre méthode (composant
SSIS...)
?
J'avais vu aussi un algo intéressant qui calcule la "editing distance" (le nombre d'opérations d'éditions qu'il faut pour passer d'une chaîne à l'autre)
Ah ca y est. Merci Google. C'est la distance de Levenhstein.
-- Patrice
"Hamet" a écrit dans le message de news:
Bonsoir
Je cherche une méthode efficace pour dédoublonner des fichiers clients. Je travaille avec sqlserver2005. j'ai entendu parler de la fonction soundex. cependant je ne trouve pas d'exemple d'utilisation de cette fonction. Avez-vous un exemple ou connaissez-vous une autre méthode (composant SSIS...) ?
J'avais vu aussi un algo intéressant qui calcule la "editing distance" (le nombre d'opérations d'éditions qu'il faut pour passer d'une chaîne à l'autre)
Ah ca y est. Merci Google. C'est la distance de Levenhstein.
Levenshtein ou hamming ou encore bien d'autres... Mais anntention au coût !!! En effet le coût du levenshtein est exponentiel.
Lisez l'article que j'ai écrit sur les doublons http://sqlpro.developpez.com/cours/doublons/
A +
-- Patrice
"Hamet" a écrit dans le message de news:
Bonsoir
Je cherche une méthode efficace pour dédoublonner des fichiers clients. Je travaille avec sqlserver2005. j'ai entendu parler de la fonction soundex. cependant je ne trouve pas d'exemple d'utilisation de cette fonction. Avez-vous un exemple ou connaissez-vous une autre méthode (composant SSIS...) ?
Merci
Hamet
-- Frédéric BROUARD, MVP SQL Server, expert bases de données et langage SQL Le site sur le langage SQL et les SGBDR : http://sqlpro.developpez.com Audit, conseil, expertise, formation, modélisation, tuning, optimisation *********************** http://www.sqlspot.com *************************
J'avais vu aussi un algo intéressant qui calcule la "editing distance" (le
nombre d'opérations d'éditions qu'il faut pour passer d'une chaîne à
l'autre)
Ah ca y est. Merci Google. C'est la distance de Levenhstein.
Levenshtein ou hamming ou encore bien d'autres... Mais anntention au
coût !!!
En effet le coût du levenshtein est exponentiel.
Lisez l'article que j'ai écrit sur les doublons
http://sqlpro.developpez.com/cours/doublons/
A +
--
Patrice
"Hamet" <Hamet@discussions.microsoft.com> a écrit dans le message de news:
30EF4BDA-E0EC-4CD4-BAB3-11E28ACAED20@microsoft.com...
Bonsoir
Je cherche une méthode efficace pour dédoublonner des fichiers clients. Je
travaille avec sqlserver2005. j'ai entendu parler de la fonction soundex.
cependant je ne trouve pas d'exemple d'utilisation de cette fonction.
Avez-vous un exemple ou connaissez-vous une autre méthode (composant
SSIS...)
?
Merci
Hamet
--
Frédéric BROUARD, MVP SQL Server, expert bases de données et langage SQL
Le site sur le langage SQL et les SGBDR : http://sqlpro.developpez.com
Audit, conseil, expertise, formation, modélisation, tuning, optimisation
*********************** http://www.sqlspot.com *************************
J'avais vu aussi un algo intéressant qui calcule la "editing distance" (le nombre d'opérations d'éditions qu'il faut pour passer d'une chaîne à l'autre)
Ah ca y est. Merci Google. C'est la distance de Levenhstein.
Levenshtein ou hamming ou encore bien d'autres... Mais anntention au coût !!! En effet le coût du levenshtein est exponentiel.
Lisez l'article que j'ai écrit sur les doublons http://sqlpro.developpez.com/cours/doublons/
A +
-- Patrice
"Hamet" a écrit dans le message de news:
Bonsoir
Je cherche une méthode efficace pour dédoublonner des fichiers clients. Je travaille avec sqlserver2005. j'ai entendu parler de la fonction soundex. cependant je ne trouve pas d'exemple d'utilisation de cette fonction. Avez-vous un exemple ou connaissez-vous une autre méthode (composant SSIS...) ?
Merci
Hamet
-- Frédéric BROUARD, MVP SQL Server, expert bases de données et langage SQL Le site sur le langage SQL et les SGBDR : http://sqlpro.developpez.com Audit, conseil, expertise, formation, modélisation, tuning, optimisation *********************** http://www.sqlspot.com *************************