Bonjour,
J'utilise openoffice 2.4, et je cherche un module ou un exemple de
script qui me permettrait d'extraire des données d'une feuille de calcul.
Le but est au final d'avoir un fichier SQL.
Il n'y a aucun "calcul" dans la feuille, ce sont juste des coordonées
postales qu'il faut insérer dans une base SQL.
Mes quelques recherches:
http://www.google.com/search?q=python+data+oocalc
http://www.google.com/search?q=python+extract+openoffice+spreadshee
Le mieux que j'ai pu entirer:
http://www.oooforum.org/forum/viewtopic.phtml?t=20830
Mais c'est tellement vieux...
Un peu. De fait, le lancement d'OOo est lent. On peut accélérer un peu, en désactivant Java dans OOo. Mais je n'ai pas réussi à descendre en dessous de 8 à 10 s (contre 2 s pour Word). Pour les cas où la vitesse est indispensable, je laisse OOo tout le temps chargé, et je jongle avec visible/invisible.
En xml j'ai fait aussi du chercher/remplacer, l'avantage c'est que c'est très rapide et que ça ne nécessite pas OO sur le serveur...
Toutafé. Mais, si on a veut imprimer... (par exemple)
Mon petit doigt me dit que tu n'as pas trouvé non plus de doc très claire ?
Bien deviné. Cela a été du tâtonnement complet, à partir d'exemples pour d'autres langages, dont de nombreux ne fonctionnent pas.
C'est pour ça que j'ai fait le minimum nécessaire.
@+ -- Michel Claveau
Re !
Ca ouvre l'interface d'OO ?
Oui.
Est-ce que ce n'est pas trop lent ?
Un peu. De fait, le lancement d'OOo est lent. On peut accélérer un peu,
en désactivant Java dans OOo. Mais je n'ai pas réussi à descendre en
dessous de 8 à 10 s (contre 2 s pour Word).
Pour les cas où la vitesse est indispensable, je laisse OOo tout le
temps chargé, et je jongle avec visible/invisible.
En xml j'ai fait aussi du chercher/remplacer, l'avantage c'est que
c'est très rapide et que ça ne nécessite pas OO sur le serveur...
Toutafé. Mais, si on a veut imprimer... (par exemple)
Mon petit doigt me dit que tu n'as pas trouvé non plus de doc très
claire ?
Bien deviné. Cela a été du tâtonnement complet, à partir d'exemples pour
d'autres langages, dont de nombreux ne fonctionnent pas.
C'est pour ça que j'ai fait le minimum nécessaire.
Un peu. De fait, le lancement d'OOo est lent. On peut accélérer un peu, en désactivant Java dans OOo. Mais je n'ai pas réussi à descendre en dessous de 8 à 10 s (contre 2 s pour Word). Pour les cas où la vitesse est indispensable, je laisse OOo tout le temps chargé, et je jongle avec visible/invisible.
En xml j'ai fait aussi du chercher/remplacer, l'avantage c'est que c'est très rapide et que ça ne nécessite pas OO sur le serveur...
Toutafé. Mais, si on a veut imprimer... (par exemple)
Mon petit doigt me dit que tu n'as pas trouvé non plus de doc très claire ?
Bien deviné. Cela a été du tâtonnement complet, à partir d'exemples pour d'autres langages, dont de nombreux ne fonctionnent pas.
C'est pour ça que j'ai fait le minimum nécessaire.
@+ -- Michel Claveau
Frédéric Momméja
Bonjour,
Mihamina Rakotomandimby a écrit :
J'utilise openoffice 2.4, et je cherche un module ou un exemple de script qui me permettrait d'extraire des données d'une feuille de calcul.
Tu pourrais jeter un oeil à : http://ooopy.sourceforge.net/
Je ne l'ai pas testé, juste bookmarqué...
-- Frédéric Momméja
Bonjour,
Mihamina Rakotomandimby a écrit :
J'utilise openoffice 2.4, et je cherche un module ou un exemple de
script qui me permettrait d'extraire des données d'une feuille de calcul.
Tu pourrais jeter un oeil à :
http://ooopy.sourceforge.net/
J'ai une classe, pour manipuler OOo depuis Python.
Mais, tu vas pleurer tes choix d'OS, car ça utilise COM, et, donc, ne fonctionne qu'avec la famille des OS Windows...
@-salutations
En tout cas, moi ça m'intéresse, surtout s'il y a un support même partiel des fichiers tableur :)
Christophe
Mihamina Rakotomandimby a écrit :
Bonjour, J'utilise openoffice 2.4, et je cherche un module ou un exemple de script qui me permettrait d'extraire des données d'une feuille de calcul. Le but est au final d'avoir un fichier SQL. Il n'y a aucun "calcul" dans la feuille, ce sont juste des coordonées postales qu'il faut insérer dans une base SQL. Mes quelques recherches: http://www.google.com/search?q=python+data+oocalc http://www.google.com/search?q=python+extract+openoffice+spreadshee
Le mieux que j'ai pu entirer: http://www.oooforum.org/forum/viewtopic.phtml?t 830 Mais c'est tellement vieux...
Ai-je les mauvais mots clés?
J'ai testé odfpy pour voir une solution complètement indépendante de OO http://opendocumentfellowship.com/projects/odfpy
Le résultat est assez mitigé, et même négatif. Globalement, le gros problème c'est que cette lib nous fournit tout simplement un moyen facile d'accès à l'arbre de représentation XML du fichier odf. Pour mon problème de parsing de fichiers d'un tableur, j'ai déjà rencontré des grosse difficultés comme la présence d'un attribut number-columns-repeated sur certaines cellules qui échappe encore à toute tentative de ma part de comprendre comment il fonctionne (bon, j'ai pas trop cherché, c'était un vendredi soir). Mais bon, dans tous les cas, la présence de ce genre de compression RLE dans le format va tout de suite grandement complexifier la lecture de celui-ci.
Donc, en plus d'avoir un format XML pas facile à lire de base, il faut carrément bien connaitre la norme d'encodage de OO pour avoir une chance d'y arriver. Odfpy est bien plus orienté pour une utilisation d'écriture de ces fichiers que de lecture (vu qu'il y a plusieurs façons de faire la même chose, on peut s'en sortir plus facilement en écriture en connaissant qu'une sous partie de la norme).
Mihamina Rakotomandimby a écrit :
Bonjour,
J'utilise openoffice 2.4, et je cherche un module ou un exemple de
script qui me permettrait d'extraire des données d'une feuille de calcul.
Le but est au final d'avoir un fichier SQL.
Il n'y a aucun "calcul" dans la feuille, ce sont juste des coordonées
postales qu'il faut insérer dans une base SQL.
Mes quelques recherches:
http://www.google.com/search?q=python+data+oocalc
http://www.google.com/search?q=python+extract+openoffice+spreadshee
Le mieux que j'ai pu entirer:
http://www.oooforum.org/forum/viewtopic.phtml?t 830
Mais c'est tellement vieux...
Ai-je les mauvais mots clés?
J'ai testé odfpy pour voir une solution complètement indépendante de OO
http://opendocumentfellowship.com/projects/odfpy
Le résultat est assez mitigé, et même négatif. Globalement, le gros
problème c'est que cette lib nous fournit tout simplement un moyen
facile d'accès à l'arbre de représentation XML du fichier odf. Pour mon
problème de parsing de fichiers d'un tableur, j'ai déjà rencontré des
grosse difficultés comme la présence d'un attribut
number-columns-repeated sur certaines cellules qui échappe encore à
toute tentative de ma part de comprendre comment il fonctionne (bon,
j'ai pas trop cherché, c'était un vendredi soir). Mais bon, dans tous
les cas, la présence de ce genre de compression RLE dans le format va
tout de suite grandement complexifier la lecture de celui-ci.
Donc, en plus d'avoir un format XML pas facile à lire de base, il faut
carrément bien connaitre la norme d'encodage de OO pour avoir une chance
d'y arriver. Odfpy est bien plus orienté pour une utilisation d'écriture
de ces fichiers que de lecture (vu qu'il y a plusieurs façons de faire
la même chose, on peut s'en sortir plus facilement en écriture en
connaissant qu'une sous partie de la norme).
Bonjour, J'utilise openoffice 2.4, et je cherche un module ou un exemple de script qui me permettrait d'extraire des données d'une feuille de calcul. Le but est au final d'avoir un fichier SQL. Il n'y a aucun "calcul" dans la feuille, ce sont juste des coordonées postales qu'il faut insérer dans une base SQL. Mes quelques recherches: http://www.google.com/search?q=python+data+oocalc http://www.google.com/search?q=python+extract+openoffice+spreadshee
Le mieux que j'ai pu entirer: http://www.oooforum.org/forum/viewtopic.phtml?t 830 Mais c'est tellement vieux...
Ai-je les mauvais mots clés?
J'ai testé odfpy pour voir une solution complètement indépendante de OO http://opendocumentfellowship.com/projects/odfpy
Le résultat est assez mitigé, et même négatif. Globalement, le gros problème c'est que cette lib nous fournit tout simplement un moyen facile d'accès à l'arbre de représentation XML du fichier odf. Pour mon problème de parsing de fichiers d'un tableur, j'ai déjà rencontré des grosse difficultés comme la présence d'un attribut number-columns-repeated sur certaines cellules qui échappe encore à toute tentative de ma part de comprendre comment il fonctionne (bon, j'ai pas trop cherché, c'était un vendredi soir). Mais bon, dans tous les cas, la présence de ce genre de compression RLE dans le format va tout de suite grandement complexifier la lecture de celui-ci.
Donc, en plus d'avoir un format XML pas facile à lire de base, il faut carrément bien connaitre la norme d'encodage de OO pour avoir une chance d'y arriver. Odfpy est bien plus orienté pour une utilisation d'écriture de ces fichiers que de lecture (vu qu'il y a plusieurs façons de faire la même chose, on peut s'en sortir plus facilement en écriture en connaissant qu'une sous partie de la norme).
chris
J'arrive un peu après la bataille mais pourquoi pas XML2OBJ
Surtout que ce qui t'interresse c'est les valeurs des colonnes après il te reste plus qu'a parcourir directement le content.xml
A+ chris
J'arrive un peu après la bataille mais pourquoi pas XML2OBJ
Surtout que ce qui t'interresse c'est les valeurs des colonnes après il
te reste plus qu'a parcourir directement le content.xml