[MOSS 2007] - Moteur de recherche

Le
Houdini
Bonjour à toutes et à tous,

Je souhaiterai savoir s'il est possible de customiser le moteur de recherche :

je voudrais exclure une liste de documents ou des documents d'une
bibliothèque dont la date de parution n'est pas atteinte ou la date
d'expiration est dépassée.
Les dates de parution et d'expiration sont des dates simples qui peuvent ou
non inclure ou exclurent les jours fériés, les fêtes.

Peut-on faire cela dans l'interface ou faut-il passer par du dév ?

- De mauvaises langues (certainement) disent que le moteur de recherche de
MOSS n'est pas très performant et qu'il souffre de lacunes vis-à-vis de la
concurrence. Est-ce la réalité (sans langue de bois) et quelles sont les
limitations ou écueils du moteur de recherche ?

Merci de votre aide.
Cordialement,
Houdini
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Lognoul, Marc \(Private\)
Le #16940311
Bonjour,

N’ayant que peu d’expertise au niveau du développement, ma réponse est
lacunaire.
Il existe deux solution, soit vous éviter l’indexation de ces éléments, soit
vous éviter leur visibilité dans les résultats d’une recherche (trimming, à
la manière du « security trimming »). Dans les deux cas, je ne vois pas, à
première de manière autre que programmatique pour y parvenir.

En ce qui concerne le moteur en lui-même, il faut se baser sur des points de
comparaison identiques et valables entre concurrents et éviter « l’anti
microsoftisme primaire ».
En pratique, je suis régulièrement confronté aux problèmes/points négatifs
suivants suivants :
- La limite de 50 million d’éléments indexables par Shared Service Provider.
50 millions cela peut paraître beaucoup à première vue mais cette limite est
accessible si on compte indexer non seulement MOSS mais également les file
shares, public folders, mailboxes, business applications… Cela empêche
régulièrement de « vendre » cette solution au management de grandes
organisations qui optent alors pour une autre solution d’enterprise search.
- L’impossibilité de rendre redondant et donc facilement hautement
disponible le rôle « Index »
- Un relatif manque de maturité obligeant de fréquente MAJ software
- L’obligation, relativement récurrente de recourir au « Full Crawl », pour
différentes raisons
- Un support natif très limité quant au backup/restore et notamment les
inconsistances possibles entre la base de donnéed et les fichiers d’index
(en particulier si ceux-ci sont propagés)
- Un support limité ou difficile à paramétrer pour l’authentification du
crawler (ex : non support du form-based par ex)
- La possibilité de contournement du « security trimming » des résultats d’une
recherche. C’est très pratique pour le développement certes mais cela ne
fait pas bonne figure face au département sécurité IT. A ma connaissance, il
n’existe pas de méthode « d’enforcement ».
- Les outils de gestion, command-line en particulier, très limités. Je ne
parle même pas d’outil de reporting ou capacity panning.
- La difficulté d’effectuer un sizing correct de l’espace de stockage
nécessaire (lié au point précédent)
- Le « bricolage » (je ne trouve pas d’autre mot) consistant à utiliser un
HOSTS file si on désire diriger le crawler vers une machine donnée dans le
cas d’un infrastructure redondante.
- ... liste non-exhaustive

…Mais que cela n’occulte pas les qualité générale du produit. En
comparaison, la Google Search Appliance parait immature, peu performante et
complexe à gérer (un comble pour une Appliance)

--
Marc
[Heureux celui qui a pu pénétrer les causes secrètes des choses]



"Houdini" news:
Bonjour à toutes et à tous,

Je souhaiterai savoir s'il est possible de customiser le moteur de
recherche :

je voudrais exclure une liste de documents ou des documents d'une
bibliothèque dont la date de parution n'est pas atteinte ou la date
d'expiration est dépassée.
Les dates de parution et d'expiration sont des dates simples qui peuvent
ou
non inclure ou exclurent les jours fériés, les fêtes.

Peut-on faire cela dans l'interface ou faut-il passer par du dév ?

- De mauvaises langues (certainement) disent que le moteur de recherche de
MOSS n'est pas très performant et qu'il souffre de lacunes vis-à-vis de la
concurrence. Est-ce la réalité (sans langue de bois) et quelles sont les
limitations ou écueils du moteur de recherche ?

Merci de votre aide.
Cordialement,
Houdini


Houdini
Le #16940261
Bonjour Marc,

Merci pour ces précisions: j'avais rencontré quelques soucis de
performances, pourtant sur des machines QuadCore avec 16 GB de Ram. Je
commence à comprendre pourquoi certains développeurs rechignent à se lancer
dans la customisation du moteur de recherche.

Cordialement,
Houdini

"Lognoul, Marc (Private)" a écrit :

Bonjour,

N’ayant que peu d’expertise au niveau du développement, ma réponse est
lacunaire.
Il existe deux solution, soit vous éviter l’indexation de ces éléments, soit
vous éviter leur visibilité dans les résultats d’une recherche (trimming, à
la manière du « security trimming »). Dans les deux cas, je ne vois pas, à
première de manière autre que programmatique pour y parvenir.

En ce qui concerne le moteur en lui-même, il faut se baser sur des points de
comparaison identiques et valables entre concurrents et éviter « l’anti
microsoftisme primaire ».
En pratique, je suis régulièrement confronté aux problèmes/points négatifs
suivants suivants :
- La limite de 50 million d’éléments indexables par Shared Service Provider.
50 millions cela peut paraître beaucoup à première vue mais cette limite est
accessible si on compte indexer non seulement MOSS mais également les file
shares, public folders, mailboxes, business applications… Cela empêche
régulièrement de « vendre » cette solution au management de grandes
organisations qui optent alors pour une autre solution d’enterprise search.
- L’impossibilité de rendre redondant et donc facilement hautement
disponible le rôle « Index »
- Un relatif manque de maturité obligeant de fréquente MAJ software
- L’obligation, relativement récurrente de recourir au « Full Crawl », pour
différentes raisons
- Un support natif très limité quant au backup/restore et notamment les
inconsistances possibles entre la base de donnéed et les fichiers d’index
(en particulier si ceux-ci sont propagés)
- Un support limité ou difficile à paramétrer pour l’authentification du
crawler (ex : non support du form-based par ex)
- La possibilité de contournement du « security trimming » des résultats d’une
recherche. C’est très pratique pour le développement certes mais cela ne
fait pas bonne figure face au département sécurité IT. A ma connaissance, il
n’existe pas de méthode « d’enforcement ».
- Les outils de gestion, command-line en particulier, très limités. Je ne
parle même pas d’outil de reporting ou capacity panning.
- La difficulté d’effectuer un sizing correct de l’espace de stockage
nécessaire (lié au point précédent)
- Le « bricolage » (je ne trouve pas d’autre mot) consistant à utiliser un
HOSTS file si on désire diriger le crawler vers une machine donnée dans le
cas d’un infrastructure redondante.
- ... liste non-exhaustive

…Mais que cela n’occulte pas les qualité générale du produit. En
comparaison, la Google Search Appliance parait immature, peu performante et
complexe à gérer (un comble pour une Appliance)

--
Marc
[Heureux celui qui a pu pénétrer les causes secrètes des choses]



"Houdini" news:
> Bonjour à toutes et à tous,
>
> Je souhaiterai savoir s'il est possible de customiser le moteur de
> recherche :
>
> je voudrais exclure une liste de documents ou des documents d'une
> bibliothèque dont la date de parution n'est pas atteinte ou la date
> d'expiration est dépassée.
> Les dates de parution et d'expiration sont des dates simples qui peuvent
> ou
> non inclure ou exclurent les jours fériés, les fêtes.
>
> Peut-on faire cela dans l'interface ou faut-il passer par du dév ?
>
> - De mauvaises langues (certainement) disent que le moteur de recherche de
> MOSS n'est pas très performant et qu'il souffre de lacunes vis-à-vis de la
> concurrence. Est-ce la réalité (sans langue de bois) et quelles sont les
> limitations ou écueils du moteur de recherche ?
>
> Merci de votre aide.
> Cordialement,
> Houdini




Lognoul, Marc \(Private\)
Le #16940251
Les problèmes de performances dont vous parlez, sont-ils lié à la fonction
de recherche (=initié par un utilisateur) ou à la fonction d'indexation
(tâche de fond)?

Marc

"Houdini" news:
Bonjour Marc,

Merci pour ces précisions: j'avais rencontré quelques soucis de
performances, pourtant sur des machines QuadCore avec 16 GB de Ram. Je
commence à comprendre pourquoi certains développeurs rechignent à se
lancer
dans la customisation du moteur de recherche.

Cordialement,
Houdini

"Lognoul, Marc (Private)" a écrit :

Bonjour,

N’ayant que peu d’expertise au niveau du développement, ma réponse est
lacunaire.
Il existe deux solution, soit vous éviter l’indexation de ces éléments,
soit
vous éviter leur visibilité dans les résultats d’une recherche (trimming,
à
la manière du « security trimming »). Dans les deux cas, je ne vois pas,
à
première de manière autre que programmatique pour y parvenir.

En ce qui concerne le moteur en lui-même, il faut se baser sur des points
de
comparaison identiques et valables entre concurrents et éviter « l’anti
microsoftisme primaire ».
En pratique, je suis régulièrement confronté aux problèmes/points
négatifs
suivants suivants :
- La limite de 50 million d’éléments indexables par Shared Service
Provider.
50 millions cela peut paraître beaucoup à première vue mais cette limite
est
accessible si on compte indexer non seulement MOSS mais également les
file
shares, public folders, mailboxes, business applications… Cela empêche
régulièrement de « vendre » cette solution au management de grandes
organisations qui optent alors pour une autre solution d’enterprise
search.
- L’impossibilité de rendre redondant et donc facilement hautement
disponible le rôle « Index »
- Un relatif manque de maturité obligeant de fréquente MAJ software
- L’obligation, relativement récurrente de recourir au « Full Crawl »,
pour
différentes raisons
- Un support natif très limité quant au backup/restore et notamment les
inconsistances possibles entre la base de donnéed et les fichiers d’index
(en particulier si ceux-ci sont propagés)
- Un support limité ou difficile à paramétrer pour l’authentification du
crawler (ex : non support du form-based par ex)
- La possibilité de contournement du « security trimming » des résultats
d’une
recherche. C’est très pratique pour le développement certes mais cela ne
fait pas bonne figure face au département sécurité IT. A ma connaissance,
il
n’existe pas de méthode « d’enforcement ».
- Les outils de gestion, command-line en particulier, très limités. Je ne
parle même pas d’outil de reporting ou capacity panning.
- La difficulté d’effectuer un sizing correct de l’espace de stockage
nécessaire (lié au point précédent)
- Le « bricolage » (je ne trouve pas d’autre mot) consistant à utiliser
un
HOSTS file si on désire diriger le crawler vers une machine donnée dans
le
cas d’un infrastructure redondante.
- ... liste non-exhaustive

…Mais que cela n’occulte pas les qualité générale du produit. En
comparaison, la Google Search Appliance parait immature, peu performante
et
complexe à gérer (un comble pour une Appliance)

--
Marc
[Heureux celui qui a pu pénétrer les causes secrètes des choses]



"Houdini" news:
> Bonjour à toutes et à tous,
>
> Je souhaiterai savoir s'il est possible de customiser le moteur de
> recherche :
>
> je voudrais exclure une liste de documents ou des documents d'une
> bibliothèque dont la date de parution n'est pas atteinte ou la date
> d'expiration est dépassée.
> Les dates de parution et d'expiration sont des dates simples qui
> peuvent
> ou
> non inclure ou exclurent les jours fériés, les fêtes.
>
> Peut-on faire cela dans l'interface ou faut-il passer par du dév ?
>
> - De mauvaises langues (certainement) disent que le moteur de recherche
> de
> MOSS n'est pas très performant et qu'il souffre de lacunes vis-à-vis de
> la
> concurrence. Est-ce la réalité (sans langue de bois) et quelles sont
> les
> limitations ou écueils du moteur de recherche ?
>
> Merci de votre aide.
> Cordialement,
> Houdini






Houdini
Le #16940241
Bonjour Marc,

En fait, pour être honnête, les 2. Si un utilisateur lance une recherche, ce
n'est pas super rapide (les machines sont quand même vives) et en tâches de
fond, l'indexation générale est lente (disques ultra rapide sur serveurs lame
HP).

J'ai creusé quelques compteurs mais rien de bien transcendant. Et ce que
l'on soit chargé ou pas. Mais, c'est aléatoire. Je n'arrive pas à reproduire
ces séquences. Pour l'instant, il y a environ 200 personnes ... j'imagine la
situation quand je vais passer à 3000 ou 5000 personnes.

Merci d'avance pour vos éclaircissements.
Cordialement,
Houdini
===================== "Lognoul, Marc (Private)" a écrit :

Les problèmes de performances dont vous parlez, sont-ils lié à la fonction
de recherche (=initié par un utilisateur) ou à la fonction d'indexation
(tâche de fond)?

Marc

"Houdini" news:
> Bonjour Marc,
>
> Merci pour ces précisions: j'avais rencontré quelques soucis de
> performances, pourtant sur des machines QuadCore avec 16 GB de Ram. Je
> commence à comprendre pourquoi certains développeurs rechignent à se
> lancer
> dans la customisation du moteur de recherche.
>
> Cordialement,
> Houdini
>
> "Lognoul, Marc (Private)" a écrit :
>
>> Bonjour,
>>
>> N’ayant que peu d’expertise au niveau du développement, ma réponse est
>> lacunaire.
>> Il existe deux solution, soit vous éviter l’indexation de ces éléments,
>> soit
>> vous éviter leur visibilité dans les résultats d’une recherche (trimming,
>> à
>> la manière du « security trimming »). Dans les deux cas, je ne vois pas,
>> à
>> première de manière autre que programmatique pour y parvenir.
>>
>> En ce qui concerne le moteur en lui-même, il faut se baser sur des points
>> de
>> comparaison identiques et valables entre concurrents et éviter « l’anti
>> microsoftisme primaire ».
>> En pratique, je suis régulièrement confronté aux problèmes/points
>> négatifs
>> suivants suivants :
>> - La limite de 50 million d’éléments indexables par Shared Service
>> Provider.
>> 50 millions cela peut paraître beaucoup à première vue mais cette limite
>> est
>> accessible si on compte indexer non seulement MOSS mais également les
>> file
>> shares, public folders, mailboxes, business applications… Cela empêche
>> régulièrement de « vendre » cette solution au management de grandes
>> organisations qui optent alors pour une autre solution d’enterprise
>> search.
>> - L’impossibilité de rendre redondant et donc facilement hautement
>> disponible le rôle « Index »
>> - Un relatif manque de maturité obligeant de fréquente MAJ software
>> - L’obligation, relativement récurrente de recourir au « Full Crawl »,
>> pour
>> différentes raisons
>> - Un support natif très limité quant au backup/restore et notamment les
>> inconsistances possibles entre la base de donnéed et les fichiers d’index
>> (en particulier si ceux-ci sont propagés)
>> - Un support limité ou difficile à paramétrer pour l’authentification du
>> crawler (ex : non support du form-based par ex)
>> - La possibilité de contournement du « security trimming » des résultats
>> d’une
>> recherche. C’est très pratique pour le développement certes mais cela ne
>> fait pas bonne figure face au département sécurité IT. A ma connaissance,
>> il
>> n’existe pas de méthode « d’enforcement ».
>> - Les outils de gestion, command-line en particulier, très limités. Je ne
>> parle même pas d’outil de reporting ou capacity panning.
>> - La difficulté d’effectuer un sizing correct de l’espace de stockage
>> nécessaire (lié au point précédent)
>> - Le « bricolage » (je ne trouve pas d’autre mot) consistant à utiliser
>> un
>> HOSTS file si on désire diriger le crawler vers une machine donnée dans
>> le
>> cas d’un infrastructure redondante.
>> - ... liste non-exhaustive
>>
>> …Mais que cela n’occulte pas les qualité générale du produit. En
>> comparaison, la Google Search Appliance parait immature, peu performante
>> et
>> complexe à gérer (un comble pour une Appliance)
>>
>> --
>> Marc
>> [Heureux celui qui a pu pénétrer les causes secrètes des choses]
>>
>>
>>
>> "Houdini" >> news:
>> > Bonjour à toutes et à tous,
>> >
>> > Je souhaiterai savoir s'il est possible de customiser le moteur de
>> > recherche :
>> >
>> > je voudrais exclure une liste de documents ou des documents d'une
>> > bibliothèque dont la date de parution n'est pas atteinte ou la date
>> > d'expiration est dépassée.
>> > Les dates de parution et d'expiration sont des dates simples qui
>> > peuvent
>> > ou
>> > non inclure ou exclurent les jours fériés, les fêtes.
>> >
>> > Peut-on faire cela dans l'interface ou faut-il passer par du dév ?
>> >
>> > - De mauvaises langues (certainement) disent que le moteur de recherche
>> > de
>> > MOSS n'est pas très performant et qu'il souffre de lacunes vis-à-vis de
>> > la
>> > concurrence. Est-ce la réalité (sans langue de bois) et quelles sont
>> > les
>> > limitations ou écueils du moteur de recherche ?
>> >
>> > Merci de votre aide.
>> > Cordialement,
>> > Houdini
>>
>>


Lognoul, Marc \(Private\)
Le #16940201
Bonjour,

Pourriez-vous (re)décrire votre architecture MOSS, de préférence avec des
détails sur la configuration hardware et réseau, si cela ne constitue pas
une atteinte à la sécurité/confidentialité bien entendu.
Vous pouvez également adresser ces infos sur ma BAL privée. Je répondrai de
manière "générique" sur le NG.

--
Marc
[Heureux celui qui a pu pénétrer les causes secrètes des choses]

"Houdini" news:
Bonjour Marc,

En fait, pour être honnête, les 2. Si un utilisateur lance une recherche,
ce
n'est pas super rapide (les machines sont quand même vives) et en tâches
de
fond, l'indexation générale est lente (disques ultra rapide sur serveurs
lame
HP).

J'ai creusé quelques compteurs mais rien de bien transcendant. Et ce que
l'on soit chargé ou pas. Mais, c'est aléatoire. Je n'arrive pas à
reproduire
ces séquences. Pour l'instant, il y a environ 200 personnes ... j'imagine
la
situation quand je vais passer à 3000 ou 5000 personnes.

Merci d'avance pour vos éclaircissements.
Cordialement,
Houdini
===================== > "Lognoul, Marc (Private)" a écrit :

Les problèmes de performances dont vous parlez, sont-ils lié à la
fonction
de recherche (=initié par un utilisateur) ou à la fonction d'indexation
(tâche de fond)?

Marc

"Houdini" news:
> Bonjour Marc,
>
> Merci pour ces précisions: j'avais rencontré quelques soucis de
> performances, pourtant sur des machines QuadCore avec 16 GB de Ram. Je
> commence à comprendre pourquoi certains développeurs rechignent à se
> lancer
> dans la customisation du moteur de recherche.
>
> Cordialement,
> Houdini
>
> "Lognoul, Marc (Private)" a écrit :
>
>> Bonjour,
>>
>> N’ayant que peu d’expertise au niveau du développement, ma réponse est
>> lacunaire.
>> Il existe deux solution, soit vous éviter l’indexation de ces
>> éléments,
>> soit
>> vous éviter leur visibilité dans les résultats d’une recherche
>> (trimming,
>> à
>> la manière du « security trimming »). Dans les deux cas, je ne vois
>> pas,
>> à
>> première de manière autre que programmatique pour y parvenir.
>>
>> En ce qui concerne le moteur en lui-même, il faut se baser sur des
>> points
>> de
>> comparaison identiques et valables entre concurrents et éviter « l’anti
>> microsoftisme primaire ».
>> En pratique, je suis régulièrement confronté aux problèmes/points
>> négatifs
>> suivants suivants :
>> - La limite de 50 million d’éléments indexables par Shared Service
>> Provider.
>> 50 millions cela peut paraître beaucoup à première vue mais cette
>> limite
>> est
>> accessible si on compte indexer non seulement MOSS mais également les
>> file
>> shares, public folders, mailboxes, business applications… Cela empêche
>> régulièrement de « vendre » cette solution au management de grandes
>> organisations qui optent alors pour une autre solution d’enterprise
>> search.
>> - L’impossibilité de rendre redondant et donc facilement hautement
>> disponible le rôle « Index »
>> - Un relatif manque de maturité obligeant de fréquente MAJ software
>> - L’obligation, relativement récurrente de recourir au « Full Crawl »,
>> pour
>> différentes raisons
>> - Un support natif très limité quant au backup/restore et notamment
>> les
>> inconsistances possibles entre la base de donnéed et les fichiers d’index
>> (en particulier si ceux-ci sont propagés)
>> - Un support limité ou difficile à paramétrer pour l’authentification
>> du
>> crawler (ex : non support du form-based par ex)
>> - La possibilité de contournement du « security trimming » des
>> résultats
>> d’une
>> recherche. C’est très pratique pour le développement certes mais cela
>> ne
>> fait pas bonne figure face au département sécurité IT. A ma
>> connaissance,
>> il
>> n’existe pas de méthode « d’enforcement ».
>> - Les outils de gestion, command-line en particulier, très limités. Je
>> ne
>> parle même pas d’outil de reporting ou capacity panning.
>> - La difficulté d’effectuer un sizing correct de l’espace de stockage
>> nécessaire (lié au point précédent)
>> - Le « bricolage » (je ne trouve pas d’autre mot) consistant à
>> utiliser
>> un
>> HOSTS file si on désire diriger le crawler vers une machine donnée
>> dans
>> le
>> cas d’un infrastructure redondante.
>> - ... liste non-exhaustive
>>
>> …Mais que cela n’occulte pas les qualité générale du produit. En
>> comparaison, la Google Search Appliance parait immature, peu
>> performante
>> et
>> complexe à gérer (un comble pour une Appliance)
>>
>> --
>> Marc
>> [Heureux celui qui a pu pénétrer les causes secrètes des choses]
>>
>>
>>
>> "Houdini" >> news:
>> > Bonjour à toutes et à tous,
>> >
>> > Je souhaiterai savoir s'il est possible de customiser le moteur de
>> > recherche :
>> >
>> > je voudrais exclure une liste de documents ou des documents d'une
>> > bibliothèque dont la date de parution n'est pas atteinte ou la date
>> > d'expiration est dépassée.
>> > Les dates de parution et d'expiration sont des dates simples qui
>> > peuvent
>> > ou
>> > non inclure ou exclurent les jours fériés, les fêtes.
>> >
>> > Peut-on faire cela dans l'interface ou faut-il passer par du dév ?
>> >
>> > - De mauvaises langues (certainement) disent que le moteur de
>> > recherche
>> > de
>> > MOSS n'est pas très performant et qu'il souffre de lacunes vis-à-vis
>> > de
>> > la
>> > concurrence. Est-ce la réalité (sans langue de bois) et quelles sont
>> > les
>> > limitations ou écueils du moteur de recherche ?
>> >
>> > Merci de votre aide.
>> > Cordialement,
>> > Houdini
>>
>>




Houdini
Le #16940161
Bonjour Marc,

Merci pour les infos.
Renseignements transmis
Cordialement,
Houdini

"Lognoul, Marc (Private)" a écrit :

Bonjour,

Pourriez-vous (re)décrire votre architecture MOSS, de préférence avec des
détails sur la configuration hardware et réseau, si cela ne constitue pas
une atteinte à la sécurité/confidentialité bien entendu.
Vous pouvez également adresser ces infos sur ma BAL privée. Je répondrai de
manière "générique" sur le NG.

--
Marc
[Heureux celui qui a pu pénétrer les causes secrètes des choses]

"Houdini" news:
> Bonjour Marc,
>
> En fait, pour être honnête, les 2. Si un utilisateur lance une recherche,
> ce
> n'est pas super rapide (les machines sont quand même vives) et en tâches
> de
> fond, l'indexation générale est lente (disques ultra rapide sur serveurs
> lame
> HP).
>
> J'ai creusé quelques compteurs mais rien de bien transcendant. Et ce que
> l'on soit chargé ou pas. Mais, c'est aléatoire. Je n'arrive pas à
> reproduire
> ces séquences. Pour l'instant, il y a environ 200 personnes ... j'imagine
> la
> situation quand je vais passer à 3000 ou 5000 personnes.
>
> Merci d'avance pour vos éclaircissements.
> Cordialement,
> Houdini
> ===================== > > "Lognoul, Marc (Private)" a écrit :
>
>> Les problèmes de performances dont vous parlez, sont-ils lié à la
>> fonction
>> de recherche (=initié par un utilisateur) ou à la fonction d'indexation
>> (tâche de fond)?
>>
>> Marc
>>
>> "Houdini" >> news:
>> > Bonjour Marc,
>> >
>> > Merci pour ces précisions: j'avais rencontré quelques soucis de
>> > performances, pourtant sur des machines QuadCore avec 16 GB de Ram. Je
>> > commence à comprendre pourquoi certains développeurs rechignent à se
>> > lancer
>> > dans la customisation du moteur de recherche.
>> >
>> > Cordialement,
>> > Houdini
>> >
>> > "Lognoul, Marc (Private)" a écrit :
>> >
>> >> Bonjour,
>> >>
>> >> N’ayant que peu d’expertise au niveau du développement, ma réponse est
>> >> lacunaire.
>> >> Il existe deux solution, soit vous éviter l’indexation de ces
>> >> éléments,
>> >> soit
>> >> vous éviter leur visibilité dans les résultats d’une recherche
>> >> (trimming,
>> >> à
>> >> la manière du « security trimming »). Dans les deux cas, je ne vois
>> >> pas,
>> >> à
>> >> première de manière autre que programmatique pour y parvenir.
>> >>
>> >> En ce qui concerne le moteur en lui-même, il faut se baser sur des
>> >> points
>> >> de
>> >> comparaison identiques et valables entre concurrents et éviter « l’anti
>> >> microsoftisme primaire ».
>> >> En pratique, je suis régulièrement confronté aux problèmes/points
>> >> négatifs
>> >> suivants suivants :
>> >> - La limite de 50 million d’éléments indexables par Shared Service
>> >> Provider.
>> >> 50 millions cela peut paraître beaucoup à première vue mais cette
>> >> limite
>> >> est
>> >> accessible si on compte indexer non seulement MOSS mais également les
>> >> file
>> >> shares, public folders, mailboxes, business applications… Cela empêche
>> >> régulièrement de « vendre » cette solution au management de grandes
>> >> organisations qui optent alors pour une autre solution d’enterprise
>> >> search.
>> >> - L’impossibilité de rendre redondant et donc facilement hautement
>> >> disponible le rôle « Index »
>> >> - Un relatif manque de maturité obligeant de fréquente MAJ software
>> >> - L’obligation, relativement récurrente de recourir au « Full Crawl »,
>> >> pour
>> >> différentes raisons
>> >> - Un support natif très limité quant au backup/restore et notamment
>> >> les
>> >> inconsistances possibles entre la base de donnéed et les fichiers d’index
>> >> (en particulier si ceux-ci sont propagés)
>> >> - Un support limité ou difficile à paramétrer pour l’authentification
>> >> du
>> >> crawler (ex : non support du form-based par ex)
>> >> - La possibilité de contournement du « security trimming » des
>> >> résultats
>> >> d’une
>> >> recherche. C’est très pratique pour le développement certes mais cela
>> >> ne
>> >> fait pas bonne figure face au département sécurité IT. A ma
>> >> connaissance,
>> >> il
>> >> n’existe pas de méthode « d’enforcement ».
>> >> - Les outils de gestion, command-line en particulier, très limités. Je
>> >> ne
>> >> parle même pas d’outil de reporting ou capacity panning.
>> >> - La difficulté d’effectuer un sizing correct de l’espace de stockage
>> >> nécessaire (lié au point précédent)
>> >> - Le « bricolage » (je ne trouve pas d’autre mot) consistant à
>> >> utiliser
>> >> un
>> >> HOSTS file si on désire diriger le crawler vers une machine donnée
>> >> dans
>> >> le
>> >> cas d’un infrastructure redondante.
>> >> - ... liste non-exhaustive
>> >>
>> >> …Mais que cela n’occulte pas les qualité générale du produit. En
>> >> comparaison, la Google Search Appliance parait immature, peu
>> >> performante
>> >> et
>> >> complexe à gérer (un comble pour une Appliance)
>> >>
>> >> --
>> >> Marc
>> >> [Heureux celui qui a pu pénétrer les causes secrètes des choses]
>> >>
>> >>
>> >>
>> >> "Houdini" >> >> news:
>> >> > Bonjour à toutes et à tous,
>> >> >
>> >> > Je souhaiterai savoir s'il est possible de customiser le moteur de
>> >> > recherche :
>> >> >
>> >> > je voudrais exclure une liste de documents ou des documents d'une
>> >> > bibliothèque dont la date de parution n'est pas atteinte ou la date
>> >> > d'expiration est dépassée.
>> >> > Les dates de parution et d'expiration sont des dates simples qui
>> >> > peuvent
>> >> > ou
>> >> > non inclure ou exclurent les jours fériés, les fêtes.
>> >> >
>> >> > Peut-on faire cela dans l'interface ou faut-il passer par du dév ?
>> >> >
>> >> > - De mauvaises langues (certainement) disent que le moteur de
>> >> > recherche
>> >> > de
>> >> > MOSS n'est pas très performant et qu'il souffre de lacunes vis-à-vis
>> >> > de
>> >> > la
>> >> > concurrence. Est-ce la réalité (sans langue de bois) et quelles sont
>> >> > les
>> >> > limitations ou écueils du moteur de recherche ?
>> >> >
>> >> > Merci de votre aide.
>> >> > Cordialement,
>> >> > Houdini
>> >>
>> >>



Publicité
Poster une réponse
Anonyme