[MOSS2007] Indexation de fichiers HTM custom

Le
TSC
Bonjour,

Je souhaite indexer avec le moteur MOSS depuis une 1ere source de
contenu des fichiers HTM personnalisés, contenant par exemple des
balises comme <EMPLOYE>xxxx</EMPLOYE>.
Evidemment, le but est de récupérer le contenu de ces balises et de
les intégrer dans une meta MOSS.

Je souhaite indexer une 2e source de contenu avec des fichier HTM
personnalisés, mais différemment, avec des balises custom differentes.

Quelle est d'après vous la solution à mettre en place ?
- un ifilter amélioré pour les *.htm ?
- un protocole handler distinct par source de contenu ?
ou autre chose ?

par avance merci pour vos lumieres !
TSC
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Lognoul, Marc \(Private\)
Le #16949241
Bonjour,

Je peux me tromper mais je ne vois pas l'intérêt de passer par un protocol
handler distinct ou "custom". Les différents protocol handlers sont est
utilisés pour indexer dans des emplacements les technologie de stockage et
les méthodes d'accès sont différentes (web, MOSS, WSS, file share, Exchange,
lotus notes...). Si les fichiers HTM sont stockés sur WSS/MOSS, il n'y a onc
pas de soucis à se faire.
Par contre, je me pose la question de du bien fondé d'inclure des tag
"custom" dans de l'HTM (conformité...). Pourquoi ne pas utiliser de l'XML
natif, dont c'est la fonction principale. De plus, l'XML fait parie des
types de contenu pouvant être indexé par les ifilter standards.

Si l'affichage pose un problème vous pouvez bien entendu passer par des XSS,
stylesheet etc, voire un webpart d'affichage d'XML (standard également).

Plus d'info, en anglais:
http://technet.microsoft.com/en-us/library/cc179511.aspx

Marc

PS: est-ce que je réponds à la question ou suis-je complètement hors-sujet ?
:)

"TSC" news:
Bonjour,

Je souhaite indexer avec le moteur MOSS depuis une 1ere source de
contenu des fichiers HTM personnalisés, contenant par exemple des
balises comme <EMPLOYE>xxxx</EMPLOYE>.
Evidemment, le but est de récupérer le contenu de ces balises et de
les intégrer dans une meta MOSS.

Je souhaite indexer une 2e source de contenu avec des fichier HTM
personnalisés, mais différemment, avec des balises custom differentes.

Quelle est d'après vous la solution à mettre en place ?
- un ifilter amélioré pour les *.htm ?
- un protocole handler distinct par source de contenu ?
ou autre chose ?

par avance merci pour vos lumieres !
TSC


TSC
Le #16949231
Bonjour,

merci pour votre réponse, je vais apporter qq elements en complement :
Je souhaite indexer des fichiers HTM existants sur des files share.
Et je n'ai pas la main sur le format de ces fichiers, le but etant
simplement de l'indexer par le moteur de recherche moss.

la réponse est partiellement HS ;-)
TSC



On 12 juin, 12:00, "Lognoul, Marc (Private)" wrote:
Bonjour,

Je peux me tromper mais je ne vois pas l'intérêt de passer par un prot ocol
handler distinct ou "custom". Les différents protocol handlers sont est
utilisés pour indexer dans des emplacements les technologie de stockage et
les méthodes d'accès sont différentes (web, MOSS, WSS, file share, E xchange,
lotus notes...). Si les fichiers HTM sont stockés sur WSS/MOSS, il n'y a onc
pas de soucis à se faire.
Par contre, je me pose la question de du bien fondé d'inclure des tag
"custom" dans de l'HTM (conformité...). Pourquoi ne pas utiliser de l'XM L
natif, dont c'est la fonction principale. De plus, l'XML fait parie des
types de contenu pouvant être indexé par les ifilter standards.

Si l'affichage pose un problème vous pouvez bien entendu passer par des XSS,
stylesheet etc, voire un webpart d'affichage d'XML (standard également).

Plus d'info, en anglais:http://technet.microsoft.com/en-us/library/cc17951 1.aspx

Marc

PS: est-ce que je réponds à la question ou suis-je complètement hors -sujet ?
:)

"TSC"
news:



> Bonjour,

> Je souhaite indexer  avec le moteur MOSS depuis une 1ere source de
> contenu des fichiers HTM personnalisés, contenant par exemple des
> balises comme <EMPLOYE>xxxx</EMPLOYE>.
> Evidemment, le but est de récupérer le contenu de ces balises et de
> les intégrer dans une meta MOSS.

> Je souhaite indexer une 2e source de contenu avec des fichier HTM
> personnalisés, mais différemment, avec des balises custom differente s.

> Quelle est d'après vous la solution à mettre en place ?
> - un ifilter amélioré pour les *.htm ?
> - un protocole handler distinct par source de contenu ?
> ou autre chose ?

> par avance merci pour vos lumieres !
> TSC- Masquer le texte des messages précédents -

- Afficher le texte des messages précédents -


Lognoul, Marc \(Private\)
Le #16949221
Vous pouvez utiliser le protocol handler standard "File" mais il reste
préférable de tester l'indexation avec les ifilters standards (htm inclus)
avant d'éventuellement passer à du développement si le résultat n'était pas
celui attendu.

Marc

"TSC" news:
Bonjour,

merci pour votre réponse, je vais apporter qq elements en complement :
Je souhaite indexer des fichiers HTM existants sur des files share.
Et je n'ai pas la main sur le format de ces fichiers, le but etant
simplement de l'indexer par le moteur de recherche moss.

la réponse est partiellement HS ;-)
TSC



On 12 juin, 12:00, "Lognoul, Marc (Private)" wrote:
Bonjour,

Je peux me tromper mais je ne vois pas l'intérêt de passer par un
protocol
handler distinct ou "custom". Les différents protocol handlers sont est
utilisés pour indexer dans des emplacements les technologie de stockage
et
les méthodes d'accès sont différentes (web, MOSS, WSS, file share,
Exchange,
lotus notes...). Si les fichiers HTM sont stockés sur WSS/MOSS, il n'y a
onc
pas de soucis à se faire.
Par contre, je me pose la question de du bien fondé d'inclure des tag
"custom" dans de l'HTM (conformité...). Pourquoi ne pas utiliser de l'XML
natif, dont c'est la fonction principale. De plus, l'XML fait parie des
types de contenu pouvant être indexé par les ifilter standards.

Si l'affichage pose un problème vous pouvez bien entendu passer par des
XSS,
stylesheet etc, voire un webpart d'affichage d'XML (standard également).

Plus d'info, en
anglais:http://technet.microsoft.com/en-us/library/cc179511.aspx

Marc

PS: est-ce que je réponds à la question ou suis-je complètement
hors-sujet ?
:)

"TSC"
news:



> Bonjour,

> Je souhaite indexer avec le moteur MOSS depuis une 1ere source de
> contenu des fichiers HTM personnalisés, contenant par exemple des
> balises comme <EMPLOYE>xxxx</EMPLOYE>.
> Evidemment, le but est de récupérer le contenu de ces balises et de
> les intégrer dans une meta MOSS.

> Je souhaite indexer une 2e source de contenu avec des fichier HTM
> personnalisés, mais différemment, avec des balises custom differentes.

> Quelle est d'après vous la solution à mettre en place ?
> - un ifilter amélioré pour les *.htm ?
> - un protocole handler distinct par source de contenu ?
> ou autre chose ?

> par avance merci pour vos lumieres !
> TSC- Masquer le texte des messages précédents -

- Afficher le texte des messages précédents -





Pierre VIVIER-MERLE
Le #16949061
Bonjour,

A première vue, je tablerais plutôt sur le développement d'un custom
ifilter.

Pierre

----------------------------------------------------------------
Pierre Vivier-Merle - MVP MOSS 2007
http://blogs.developpeur.org/pierre


"TSC"
Bonjour,

merci pour votre réponse, je vais apporter qq elements en complement :
Je souhaite indexer des fichiers HTM existants sur des files share.
Et je n'ai pas la main sur le format de ces fichiers, le but etant
simplement de l'indexer par le moteur de recherche moss.

la réponse est partiellement HS ;-)
TSC



On 12 juin, 12:00, "Lognoul, Marc (Private)" wrote:
Bonjour,

Je peux me tromper mais je ne vois pas l'intérêt de passer par un
protocol
handler distinct ou "custom". Les différents protocol handlers sont est
utilisés pour indexer dans des emplacements les technologie de stockage
et
les méthodes d'accès sont différentes (web, MOSS, WSS, file share,
Exchange,
lotus notes...). Si les fichiers HTM sont stockés sur WSS/MOSS, il n'y a
onc
pas de soucis à se faire.
Par contre, je me pose la question de du bien fondé d'inclure des tag
"custom" dans de l'HTM (conformité...). Pourquoi ne pas utiliser de l'XML
natif, dont c'est la fonction principale. De plus, l'XML fait parie des
types de contenu pouvant être indexé par les ifilter standards.

Si l'affichage pose un problème vous pouvez bien entendu passer par des
XSS,
stylesheet etc, voire un webpart d'affichage d'XML (standard également).

Plus d'info, en
anglais:http://technet.microsoft.com/en-us/library/cc179511.aspx

Marc

PS: est-ce que je réponds à la question ou suis-je complètement
hors-sujet ?
:)

"TSC"
news:



> Bonjour,

> Je souhaite indexer avec le moteur MOSS depuis une 1ere source de
> contenu des fichiers HTM personnalisés, contenant par exemple des
> balises comme <EMPLOYE>xxxx</EMPLOYE>.
> Evidemment, le but est de récupérer le contenu de ces balises et de
> les intégrer dans une meta MOSS.

> Je souhaite indexer une 2e source de contenu avec des fichier HTM
> personnalisés, mais différemment, avec des balises custom differentes.

> Quelle est d'après vous la solution à mettre en place ?
> - un ifilter amélioré pour les *.htm ?
> - un protocole handler distinct par source de contenu ?
> ou autre chose ?

> par avance merci pour vos lumieres !
> TSC- Masquer le texte des messages précédents -

- Afficher le texte des messages précédents -





EROL MVP MOSS
Le #16949051
Bonjour,

Là pour des IFilter et INFOS:
http://outilsmoss.blogspot.com/search/label/IFilter

Visio en FR

Visio IFilter 2003 Add-in: Text Search in Visio Files

Microsoft Visio IFilter 2003 est un composant utilisé par le service
d'indexation Microsoft Windows Indexing Service et Microsoft Office
SharePointT Portal Server 2003 pour extraire des chaînes de texte des
fichiers Microsoft Visio (formats .VSD, .VSS, .VST, .VDX, .VSX, et .VTX).
Les chaînes de texte sont alors indexées par ces serveurs et les index
résultants sont mis à la disposition de plusieurs applications clientes qui
proposent une interface utilisateur de recherche de chaînes de texte dans
des fichiers. Ces clients de recherche sont les suivants : Visio 2003 Find
Shape, Windows 2000 et Windows XP File Explorer, Office 2003, Microsoft
Windows SharePointT Services 2003 et SharePoint Portal Server.

http://www.microsoft.com/downloads/details.aspx?displaylang=fr&FamilyIDÜee9e09-448b-4386-b901-efea29cac808

Téléchargement, mais pour les plates-formes ENG
This download will install and register IFilters with the Windows Indexing
Service. These IFilters are used by Microsoft Search products to index the
contents of specific document formats. This Filter Pack includes IFilters
for the following formats: .docx, .docm, .pptx, .pptm, .xlsx, .xlsm, .xlsb,
.zip, .one, .vdx, .vsd, .vss, .vst, .vdx, .vsx, and .vtx.

Because Windows Desktop Search (WDS) consumes IFilters from Windows Indexing
Service, the IFilters will be automatically registered and available for use
by WDS.

http://www.microsoft.com/downloads/details.aspx?FamilyId`C92A37-719C-4077-B5C6-CAC34F4227CC&displaylang=en

MSDN très technique & dev.
http://msdn.microsoft.com/en-us/library/ms691105.aspx

Platform SDK: Indexing Service
IFilter
The IFilter interface scans documents for text and properties (also called
attributes). It extracts chunks of text from these documents, filtering out
embedded formatting and retaining information about the position of the
text. It also extracts chunks of values, which are properties of an entire
document or of well-defined parts of a document. IFilter provides the
foundation for building higher-level applications such as document indexers
and application-independent viewers.

Desktop Search IFilters

Windows Desktop Search uses plug-ins called IFilters to enable it to index
new file types. IFilters are used by several other Microsoft products,
including Index Server, Sharepoint, and SQL Server. By downloading new
IFilters - for example, from http://addins.msn.com - you can search more
filetypes. You can even write your own!

http://channel9.msdn.com/wiki/desktopsearchifilters/


IFilter Shop

http://www.ifiltershop.com/

---------------------------------------
Pour La réunion du CLUB MOSS le mercredi 25 Juin à 13h merci de vous
inscrire là :

http://www.viadeo.com/fr/event/006airfgzpvmvrz/1-2_jour_sur_1_sujet_%3A_SEARCH_%26_MOSS_%2B_WSSv3

Cdlt

--
P. Erol GIRAUDY
Président du Club MOSS 2007 et MUG.
Vice-Président Club UGO2007
http://clubmoss2007.org


"Pierre VIVIER-MERLE" message de groupe de discussion :

Bonjour,

A première vue, je tablerais plutôt sur le développement d'un custom
ifilter.

Pierre

----------------------------------------------------------------
Pierre Vivier-Merle - MVP MOSS 2007
http://blogs.developpeur.org/pierre


"TSC" :
Bonjour,

merci pour votre réponse, je vais apporter qq elements en complement :
Je souhaite indexer des fichiers HTM existants sur des files share.
Et je n'ai pas la main sur le format de ces fichiers, le but etant
simplement de l'indexer par le moteur de recherche moss.

la réponse est partiellement HS ;-)
TSC



On 12 juin, 12:00, "Lognoul, Marc (Private)" wrote:
Bonjour,

Je peux me tromper mais je ne vois pas l'intérêt de passer par un
protocol
handler distinct ou "custom". Les différents protocol handlers sont est
utilisés pour indexer dans des emplacements les technologie de stockage
et
les méthodes d'accès sont différentes (web, MOSS, WSS, file share,
Exchange,
lotus notes...). Si les fichiers HTM sont stockés sur WSS/MOSS, il n'y a
onc
pas de soucis à se faire.
Par contre, je me pose la question de du bien fondé d'inclure des tag
"custom" dans de l'HTM (conformité...). Pourquoi ne pas utiliser de
l'XML
natif, dont c'est la fonction principale. De plus, l'XML fait parie des
types de contenu pouvant être indexé par les ifilter standards.

Si l'affichage pose un problème vous pouvez bien entendu passer par des
XSS,
stylesheet etc, voire un webpart d'affichage d'XML (standard également).

Plus d'info, en
anglais:http://technet.microsoft.com/en-us/library/cc179511.aspx

Marc

PS: est-ce que je réponds à la question ou suis-je complètement
hors-sujet ?
:)

"TSC"
news:



> Bonjour,

> Je souhaite indexer avec le moteur MOSS depuis une 1ere source de
> contenu des fichiers HTM personnalisés, contenant par exemple des
> balises comme <EMPLOYE>xxxx</EMPLOYE>.
> Evidemment, le but est de récupérer le contenu de ces balises et de
> les intégrer dans une meta MOSS.

> Je souhaite indexer une 2e source de contenu avec des fichier HTM
> personnalisés, mais différemment, avec des balises custom differentes.

> Quelle est d'après vous la solution à mettre en place ?
> - un ifilter amélioré pour les *.htm ?
> - un protocole handler distinct par source de contenu ?
> ou autre chose ?

> par avance merci pour vos lumieres !
> TSC- Masquer le texte des messages précédents -

- Afficher le texte des messages précédents -







Publicité
Poster une réponse
Anonyme