[Cherche logiciel ou méthode] importer une base non structurée
Le
Baton .rouge

Bonjour
J'ai un fichier (rapport au format texte) détaillant des points d'un
vieux programme.
Il n'est pas structuré :
- ni par des [bloc] comme dans les fichier ini
- ni par des tabulation
- ni du type "xml"
ça ressemble à ça :
bloc 1 (TshirtGroupe1) AA1
description : XXXXXXXXXXXXXXX Taille : XXXXXXXXXXXX
reference : XXXXXXXXXXXXXXXXXX
bloc 1 (TshirtGroupe1) BB1
Couleur : XXXXXXXXXX
bloc 1 (TshirtGroupe1) CC1
fournisseur: XXXXXXXXXX
Fin de page 1
bloc 2 (TshirtGroupe1) AA1
description : XXXXXXXXXXXXXXX Taille : XXXXXXXXXXXX
reference : XXXXXXXXXXXXXXXXXX
bloc 2 (TshirtGroupe1) BB1
Couleur : XXXXXXXXXX
bloc 2 (TshirtGroupe1) CC1
fournisseur: XXXXXXXXXX
Fin de page 2
bloc 3 (PantalontGroupe1) AA1
reference : XXXXXXXXXXXXXXXXXX
Taille : XXXXXX
Couleur : XXXXXXXXXX
bloc 3 (PantalontGroupe1) CC1
Température : XXXXXXXXXX
Fin de page 3
Voilà en gros le style de 3 blocs parmis des centaine qui peuvent être
très différence. et j'en ai des centaine de fichiers de 40 ou 50 pages
(uniquement des espace, pas de tabulation)
Donc je cherhce un moyen de traiter cela au mieux pour en sortir un
csv puis une base access
Existe t il un logiciel capable d'apprendre de faire ça ?
Il y a déjà des repères :
- les ""
- les "bloc X"
- les parenthèses
- les libellé précédant les ":"
Merci de votre aide pour une éventuelle piste.
--
Vous voulez un conseil ?
Ne faites jamais confiance à ceux qui vous donnent des conseils.
J'ai un fichier (rapport au format texte) détaillant des points d'un
vieux programme.
Il n'est pas structuré :
- ni par des [bloc] comme dans les fichier ini
- ni par des tabulation
- ni du type "xml"
ça ressemble à ça :
bloc 1 (TshirtGroupe1) AA1
description : XXXXXXXXXXXXXXX Taille : XXXXXXXXXXXX
reference : XXXXXXXXXXXXXXXXXX
bloc 1 (TshirtGroupe1) BB1
Couleur : XXXXXXXXXX
bloc 1 (TshirtGroupe1) CC1
fournisseur: XXXXXXXXXX
Fin de page 1
bloc 2 (TshirtGroupe1) AA1
description : XXXXXXXXXXXXXXX Taille : XXXXXXXXXXXX
reference : XXXXXXXXXXXXXXXXXX
bloc 2 (TshirtGroupe1) BB1
Couleur : XXXXXXXXXX
bloc 2 (TshirtGroupe1) CC1
fournisseur: XXXXXXXXXX
Fin de page 2
bloc 3 (PantalontGroupe1) AA1
reference : XXXXXXXXXXXXXXXXXX
Taille : XXXXXX
Couleur : XXXXXXXXXX
bloc 3 (PantalontGroupe1) CC1
Température : XXXXXXXXXX
Fin de page 3
Voilà en gros le style de 3 blocs parmis des centaine qui peuvent être
très différence. et j'en ai des centaine de fichiers de 40 ou 50 pages
(uniquement des espace, pas de tabulation)
Donc je cherhce un moyen de traiter cela au mieux pour en sortir un
csv puis une base access
Existe t il un logiciel capable d'apprendre de faire ça ?
Il y a déjà des repères :
- les ""
- les "bloc X"
- les parenthèses
- les libellé précédant les ":"
Merci de votre aide pour une éventuelle piste.
--
Vous voulez un conseil ?
Ne faites jamais confiance à ceux qui vous donnent des conseils.
Il était coincé dans la boite d'envoi
J'en profite pour répondre.
Je n'ai pas l'autorisation de fournir la base réel. La base ne concerne pas des tshirt ou autre pantalon, mais des données
sensible sur des clients qui ne seront certainement pas enchanté de voir leur coordonée et autre info circuler sur le net.
pour importer cette base qui comporte environ 40 blocs de style différents sur l'ensemble de la base et pas mal de fichier
différent, je vais utiliser le principe du masque.
En fonction de ce qui se trouve juste au dessus de chaque "-------------------------------" je vais faire passer le bloc dans une
moulinette qui va chercher chaque info suivant des coordonées X et Y de ce masque puis remplir un fichier CSV.
Voilà en gros le principe.
On Tue, 29 Oct 2013 17:12:04 +0100, Baton .rouge
--
Vous voulez un conseil ?
Ne faites jamais confiance à ceux qui vous donnent des conseils.