[Cherche logiciel ou méthode] importer une base non structurée

Le
Baton .rouge
Bonjour

J'ai un fichier (rapport au format texte) détaillant des points d'un
vieux programme.
Il n'est pas structuré :
- ni par des [bloc] comme dans les fichier ini
- ni par des tabulation
- ni du type "xml"

ça ressemble à ça :

bloc 1 (TshirtGroupe1) AA1

description : XXXXXXXXXXXXXXX Taille : XXXXXXXXXXXX
reference : XXXXXXXXXXXXXXXXXX

bloc 1 (TshirtGroupe1) BB1

Couleur : XXXXXXXXXX

bloc 1 (TshirtGroupe1) CC1

fournisseur: XXXXXXXXXX

Fin de page 1

bloc 2 (TshirtGroupe1) AA1

description : XXXXXXXXXXXXXXX Taille : XXXXXXXXXXXX
reference : XXXXXXXXXXXXXXXXXX

bloc 2 (TshirtGroupe1) BB1

Couleur : XXXXXXXXXX

bloc 2 (TshirtGroupe1) CC1

fournisseur: XXXXXXXXXX

Fin de page 2

bloc 3 (PantalontGroupe1) AA1

reference : XXXXXXXXXXXXXXXXXX
Taille : XXXXXX
Couleur : XXXXXXXXXX

bloc 3 (PantalontGroupe1) CC1

Température : XXXXXXXXXX

Fin de page 3







Voilà en gros le style de 3 blocs parmis des centaine qui peuvent être
très différence. et j'en ai des centaine de fichiers de 40 ou 50 pages
(uniquement des espace, pas de tabulation)

Donc je cherhce un moyen de traiter cela au mieux pour en sortir un
csv puis une base access

Existe t il un logiciel capable d'apprendre de faire ça ?

Il y a déjà des repères :
- les ""
- les "bloc X"
- les parenthèses
- les libellé précédant les ":"

Merci de votre aide pour une éventuelle piste.







--
Vous voulez un conseil ?
Ne faites jamais confiance à ceux qui vous donnent des conseils.
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Baton .rouge
Le #25767472
Ne pas tenir compte de ce post.
Il était coincé dans la boite d'envoi

J'en profite pour répondre.

Je n'ai pas l'autorisation de fournir la base réel. La base ne concerne pas des tshirt ou autre pantalon, mais des données
sensible sur des clients qui ne seront certainement pas enchanté de voir leur coordonée et autre info circuler sur le net.


pour importer cette base qui comporte environ 40 blocs de style différents sur l'ensemble de la base et pas mal de fichier
différent, je vais utiliser le principe du masque.

En fonction de ce qui se trouve juste au dessus de chaque "-------------------------------" je vais faire passer le bloc dans une
moulinette qui va chercher chaque info suivant des coordonées X et Y de ce masque puis remplir un fichier CSV.

Voilà en gros le principe.






On Tue, 29 Oct 2013 17:12:04 +0100, Baton .rouge
Bonjour

J'ai un fichier (rapport au format texte) détaillant des points d'un
vieux programme.
Il n'est pas structuré :
- ni par des [bloc] comme dans les fichier ini
- ni par des tabulation
- ni du type "xml"

ça ressemble à ça :

bloc 1 (TshirtGroupe1) AA1
---------------------------------
description : XXXXXXXXXXXXXXX Taille : XXXXXXXXXXXX
reference : XXXXXXXXXXXXXXXXXX

bloc 1 (TshirtGroupe1) BB1
---------------------------------
Couleur : XXXXXXXXXX

bloc 1 (TshirtGroupe1) CC1
---------------------------------
fournisseur: XXXXXXXXXX

Fin de page 1

bloc 2 (TshirtGroupe1) AA1
---------------------------------
description : XXXXXXXXXXXXXXX Taille : XXXXXXXXXXXX
reference : XXXXXXXXXXXXXXXXXX

bloc 2 (TshirtGroupe1) BB1
---------------------------------
Couleur : XXXXXXXXXX

bloc 2 (TshirtGroupe1) CC1
---------------------------------
fournisseur: XXXXXXXXXX

Fin de page 2

bloc 3 (PantalontGroupe1) AA1
---------------------------------
reference : XXXXXXXXXXXXXXXXXX
Taille : XXXXXX
Couleur : XXXXXXXXXX

bloc 3 (PantalontGroupe1) CC1
---------------------------------
Température : XXXXXXXXXX

Fin de page 3







Voilà en gros le style de 3 blocs parmis des centaine qui peuvent être
très différence. et j'en ai des centaine de fichiers de 40 ou 50 pages
(uniquement des espace, pas de tabulation)

Donc je cherhce un moyen de traiter cela au mieux pour en sortir un
csv puis une base access

Existe t il un logiciel capable d'apprendre de faire ça ?

Il y a déjà des repères :
- les "---------------------------------"
- les "bloc X"
- les parenthèses
- les libellé précédant les ":"

Merci de votre aide pour une éventuelle piste.


--
Vous voulez un conseil ?
Ne faites jamais confiance à ceux qui vous donnent des conseils.
Publicité
Poster une réponse
Anonyme