OVH Cloud OVH Cloud

Deduplications et word index

1 réponse
Avatar
Jean-Francois Boitard
Je cherche de la littérature sur des word index (index par mots ou autres
index full texte ou toute méthode donnant le même résultat).
Ceci pour rapprocher des fichiers de personnes physiques ou morales.
Par exemple pour trouver "SOC DE CONSEIL TRUC" alors qu'il y a dans la base
"TRUC CONSEIL", c'est sur que l'on ne trouve pas avec un index sur le champ,
même générique et a moins de faire une lecture séquentielle, comment trouver
rapidement ?
L'application concerne des bases de 10 aines de millions d'enregistrements,
donc on ne load pas tout en cpu...
Y a t'il des SGBDR qui ont des index de ce type (ou des SGBD MV bien sur :-)

PS: si vous pouviez éviter de poster des 100 aines de messages relatif au
cursus universitaires dans un groupe SGBD, il y aurait peut être des SGBD
français :-)

a+

Jean-Francois BOITARD Wegener

1 réponse

Avatar
Jacques Caron
Salut,

On Wed, 29 Jun 2005 23:13:31 +0200, Jean-Francois Boitard
wrote:

Y a t'il des SGBDR qui ont des index de ce type



Postgresql, cf tsearch2.

http://www.sai.msu.su/~megera/postgres/gist/tsearch/V2/

Ca va même un peu plus loin que ça, mais je te laisse découvrir.

Jacques.