Bêtise et récupération de fichiers

Jacques-Daniel PILLON

11/06/2005 à 00:10

>
Je m'attelle à appliquer la même méthode pour les documents openoffice
mais là, si j'arrive à retrouver une 30 de fichiers openoffice (en me
fondant sur les «magicnumbers»), il est impossible de filtrer ces
fichiers par un grep où même de les ouvrir, apparemment openoffice ne
supporte pas un fichier rallongé par des octets quelconques. Quelqu'un
aurait une idée sur une méthode pour restaurer des fichiers openoffice?

François Boisson

Bonsoir,
je ne sais pas si cela peut vous aider :

http://www-igm.univ-mlv.fr/~dr/XPOSE2004/apierron/StructSXW.html

--
Cordialement
--------------------------------------------
Jacques-Daniel PILLON
--------------------------------------------

--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact

Jacques-Daniel PILLON

11/06/2005 à 00:30

>
Je m'attelle à appliquer la même méthode pour les documents openoffice
mais là, si j'arrive à retrouver une 30 de fichiers openoffice (en me
fondant sur les «magicnumbers»), il est impossible de filtrer ces
fichiers par un grep où même de les ouvrir, apparemment openoffice ne
supporte pas un fichier rallongé par des octets quelconques. Quelqu'un
aurait une idée sur une méthode pour restaurer des fichiers openoffice?

François Boisson

Un petit test :

:~/testopenoffice$ unzip test.sxw
Archive: test.sxw
extracting: mimetype
inflating: content.xml
inflating: styles.xml
extracting: meta.xml
inflating: settings.xml
inflating: META-INF/manifest.xml
:~/testopenoffice$ ls
content.xml META-INF meta.xml mimetype settings.xml styles.xml
test.sxw
:~/testopenoffice$

Le document openoffice contient seulement : "Fichier de test openoffice"

On retrouve ce texte dans content.xml (vers la fin):

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE office:document-content PUBLIC "-//OpenOffice.org//DTD
OfficeDocument 1.0//EN" "office.dtd">
<office:document-content
xmlns:office="http://openoffice.org/2000/office"
xmlns:style="http://openoffice.org/2000/style"
xmlns:text="http://openoffice.org/2000/text"
xmlns:table="http://openoffice.org/2000/table"
xmlns:draw="http://openoffice.org/2000/drawing"
xmlns:fo="http://www.w3.org/1999/XSL/Format"
xmlns:xlink="http://www.w3.org/1999/xlink"
xmlns:number="http://openoffice.org/2000/datastyle"
xmlns:svg="http://www.w3.org/2000/svg"
xmlns:chart="http://openoffice.org/2000/chart"
xmlns:dr3d="http://openoffice.org/2000/dr3d"
xmlns:math="http://www.w3.org/1998/Math/MathML"
xmlns:form="http://openoffice.org/2000/form"
xmlns:script="http://openoffice.org/2000/script" office:class="text"
office:version="1.0">
<office:script/>
<office:font-decls>
<style:font-decl style:name="Tahoma1" fo:font-family="Tahoma,
Lucidasans, 'Lucida Sans', 'Arial Unicode MS'"/>
<style:font-decl style:name="Bitstream Vera Sans"
fo:font-family="'Bitstream Vera Sans'"
style:font-pitch="variable"/>
<style:font-decl style:name="Tahoma" fo:font-family="Tahoma,
Lucidasans, 'Lucida Sans', 'Arial Unicode MS'"
style:font-pitch="variable"/>
<style:font-decl style:name="Nimbus Roman No9 L"
fo:font-family="'Nimbus Roman No9 L'"
style:font-family-generic="roman" style:font-pitch="variable"/>
</office:font-decls>
<office:automatic-styles/>
<office:body>
<text:sequence-decls>
<text:sequence-decl text:display-outline-level="0"
text:name="Illustration"/>
<text:sequence-decl text:display-outline-level="0" text:name="Table"/>
<text:sequence-decl text:display-outline-level="0" text:name="Text"/>
<text:sequence-decl text:display-outline-level="0" text:name="Drawing"/>
</text:sequence-decls>
<text:p text:style-name="Standard">Fichier de test openoffice</text:p>
</office:body>
</office:document-content>

En espérant faire avancer le shimiliblique... ;)

--
Cordialement
--------------------------------------------
Jacques-Daniel PILLON
--------------------------------------------

--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact

>
Je m'attelle à appliquer la même méthode pour les documents openoffice
mais là, si j'arrive à retrouver une 30 de fichiers openoffice (en me
fondant sur les «magicnumbers»), il est impossible de filtrer ces
fichiers par un grep où même de les ouvrir, apparemment openoffice ne
supporte pas un fichier rallongé par des octets quelconques. Quelqu'un
aurait une idée sur une méthode pour restaurer des fichiers openoffice?

François Boisson

Un petit test :

jdpillon@developpement:~/testopenoffice$ unzip test.sxw
Archive: test.sxw
extracting: mimetype
inflating: content.xml
inflating: styles.xml
extracting: meta.xml
inflating: settings.xml
inflating: META-INF/manifest.xml
jdpillon@developpement:~/testopenoffice$ ls
content.xml META-INF meta.xml mimetype settings.xml styles.xml
test.sxw
jdpillon@developpement:~/testopenoffice$

Le document openoffice contient seulement : "Fichier de test openoffice"

On retrouve ce texte dans content.xml (vers la fin):

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE office:document-content PUBLIC "-//OpenOffice.org//DTD
OfficeDocument 1.0//EN" "office.dtd">
<office:document-content
xmlns:office="http://openoffice.org/2000/office"
xmlns:style="http://openoffice.org/2000/style"
xmlns:text="http://openoffice.org/2000/text"
xmlns:table="http://openoffice.org/2000/table"
xmlns:draw="http://openoffice.org/2000/drawing"
xmlns:fo="http://www.w3.org/1999/XSL/Format"
xmlns:xlink="http://www.w3.org/1999/xlink"
xmlns:number="http://openoffice.org/2000/datastyle"
xmlns:svg="http://www.w3.org/2000/svg"
xmlns:chart="http://openoffice.org/2000/chart"
xmlns:dr3d="http://openoffice.org/2000/dr3d"
xmlns:math="http://www.w3.org/1998/Math/MathML"
xmlns:form="http://openoffice.org/2000/form"
xmlns:script="http://openoffice.org/2000/script" office:class="text"
office:version="1.0">
<office:script/>
<office:font-decls>
<style:font-decl style:name="Tahoma1" fo:font-family="Tahoma,
Lucidasans, 'Lucida Sans', 'Arial Unicode MS'"/>
<style:font-decl style:name="Bitstream Vera Sans"
fo:font-family="'Bitstream Vera Sans'"
style:font-pitch="variable"/>
<style:font-decl style:name="Tahoma" fo:font-family="Tahoma,
Lucidasans, 'Lucida Sans', 'Arial Unicode MS'"
style:font-pitch="variable"/>
<style:font-decl style:name="Nimbus Roman No9 L"
fo:font-family="'Nimbus Roman No9 L'"
style:font-family-generic="roman" style:font-pitch="variable"/>
</office:font-decls>
<office:automatic-styles/>
<office:body>
<text:sequence-decls>
<text:sequence-decl text:display-outline-level="0"
text:name="Illustration"/>
<text:sequence-decl text:display-outline-level="0" text:name="Table"/>
<text:sequence-decl text:display-outline-level="0" text:name="Text"/>
<text:sequence-decl text:display-outline-level="0" text:name="Drawing"/>
</text:sequence-decls>
<text:p text:style-name="Standard">Fichier de test openoffice</text:p>
</office:body>
</office:document-content>

En espérant faire avancer le shimiliblique... ;)

--
Cordialement
--------------------------------------------
Jacques-Daniel PILLON
--------------------------------------------

--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to debian-user-french-REQUEST@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org

Vous avez filtré cet utilisateur ! Consultez son message

>
Je m'attelle à appliquer la même méthode pour les documents openoffice
mais là, si j'arrive à retrouver une 30 de fichiers openoffice (en me
fondant sur les «magicnumbers»), il est impossible de filtrer ces
fichiers par un grep où même de les ouvrir, apparemment openoffice ne
supporte pas un fichier rallongé par des octets quelconques. Quelqu'un
aurait une idée sur une méthode pour restaurer des fichiers openoffice?

François Boisson

Un petit test :

:~/testopenoffice$ unzip test.sxw
Archive: test.sxw
extracting: mimetype
inflating: content.xml
inflating: styles.xml
extracting: meta.xml
inflating: settings.xml
inflating: META-INF/manifest.xml
:~/testopenoffice$ ls
content.xml META-INF meta.xml mimetype settings.xml styles.xml
test.sxw
:~/testopenoffice$

Le document openoffice contient seulement : "Fichier de test openoffice"

On retrouve ce texte dans content.xml (vers la fin):

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE office:document-content PUBLIC "-//OpenOffice.org//DTD
OfficeDocument 1.0//EN" "office.dtd">
<office:document-content
xmlns:office="http://openoffice.org/2000/office"
xmlns:style="http://openoffice.org/2000/style"
xmlns:text="http://openoffice.org/2000/text"
xmlns:table="http://openoffice.org/2000/table"
xmlns:draw="http://openoffice.org/2000/drawing"
xmlns:fo="http://www.w3.org/1999/XSL/Format"
xmlns:xlink="http://www.w3.org/1999/xlink"
xmlns:number="http://openoffice.org/2000/datastyle"
xmlns:svg="http://www.w3.org/2000/svg"
xmlns:chart="http://openoffice.org/2000/chart"
xmlns:dr3d="http://openoffice.org/2000/dr3d"
xmlns:math="http://www.w3.org/1998/Math/MathML"
xmlns:form="http://openoffice.org/2000/form"
xmlns:script="http://openoffice.org/2000/script" office:class="text"
office:version="1.0">
<office:script/>
<office:font-decls>
<style:font-decl style:name="Tahoma1" fo:font-family="Tahoma,
Lucidasans, 'Lucida Sans', 'Arial Unicode MS'"/>
<style:font-decl style:name="Bitstream Vera Sans"
fo:font-family="'Bitstream Vera Sans'"
style:font-pitch="variable"/>
<style:font-decl style:name="Tahoma" fo:font-family="Tahoma,
Lucidasans, 'Lucida Sans', 'Arial Unicode MS'"
style:font-pitch="variable"/>
<style:font-decl style:name="Nimbus Roman No9 L"
fo:font-family="'Nimbus Roman No9 L'"
style:font-family-generic="roman" style:font-pitch="variable"/>
</office:font-decls>
<office:automatic-styles/>
<office:body>
<text:sequence-decls>
<text:sequence-decl text:display-outline-level="0"
text:name="Illustration"/>
<text:sequence-decl text:display-outline-level="0" text:name="Table"/>
<text:sequence-decl text:display-outline-level="0" text:name="Text"/>
<text:sequence-decl text:display-outline-level="0" text:name="Drawing"/>
</text:sequence-decls>
<text:p text:style-name="Standard">Fichier de test openoffice</text:p>
</office:body>
</office:document-content>

En espérant faire avancer le shimiliblique... ;)

--
Cordialement
--------------------------------------------
Jacques-Daniel PILLON
--------------------------------------------

--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact

David Dumortier

11/06/2005 à 08:20

Bonjour,

J'archive ton mail pour le futur :-)

François Boisson wrote:
[...]

Je m'attelle à appliquer la même méthode pour les documents openoffice
mais là, si j'arrive à retrouver une 30 de fichiers openoffice (en me
fondant sur les «magicnumbers»), il est impossible de filtrer ces
fichiers par un grep où même de les ouvrir, apparemment openoffice ne
supporte pas un fichier rallongé par des octets quelconques. Quelqu'un
aurait une idée sur une méthode pour restaurer des fichiers openoffice?

Il semble que le dernier fichier soit META-INF/manifest.xml
immédiatement suivi de PK et un CRC ou le contenu compressé, m'enfin
c'est variable comme donné, par contre la longueur semble la même (10
octets testé sur des fichiers de quelques caractères (1) à plusieurs
100Ko (un peu plus de 1)).
Résumons META-INF/manifest.xmlPK+10octets
Un sed 's/(.*META-INF/manifest.xmlPK.{10}).*/1/' semble fonctionné
(si tu n'a pas 2 fichiers OOo dans ton bidule).

Bon courage.
--
David

--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact

François Boisson

11/06/2005 à 11:10

Hmm, les fichiers que j'ai sont effectivement des débuts d'archives.

J'ai effectivement construits ces fichiers en cherchant un entête de la
forme "50 4B 03 04 14 00 00 00".

Cependant un appel à gunzip donne

gunzip: Offi.gz has more than one entry -- unchanged

(évidemment, je sais bien qu'il y a plusieurs fichiers...)

unzip gueule en disant que l'archive n'est pas bonne.

je n'arrive pas à trouver un désarchiveur tolérant!!

Une étude avec hexedit à la suite des indications que vous
(Jacques-Daniel et David) m'avez données sur les fichiers openoffice
obtenus montre que cet entête existe plein de fois. De là à imaginer que
le fichier est une bête concaténation de fichier .gz, il y a un pas que
je franchis allègrement (je ne suis pas à ça près). Bon, je vais écrire
un programme qui va découper le fichieren autant de fichier commençant
par cet entête, à suivre...

François Boisson

--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact

François Boisson

11/06/2005 à 11:30

>
Une étude avec hexedit à la suite des indications que vous
(Jacques-Daniel et David) m'avez données sur les fichiers openoffice
obtenus montre que cet entête existe plein de fois. De là à imaginer
que le fichier est une bête concaténation de fichier .gz, il y a un
pas que je franchis allègrement (je ne suis pas à ça près). Bon, je
vais écrire un programme qui va découper le fichieren autant de
fichier commençant par cet entête, à suivre...

Eh, eh... Mon petit programme marche au poil, effectivement, j'obtiens
des tas de fichiers dézippés.

Avec les renseignements de Jean Daniel, je vais pouvoir faire un grep
sur le type (premier fichier) et le contenu (deuxième fichier). Je
considère mon fichier comme retrouvé (joie, bonheur!)

En espérant à tous que cette journée soit aussi bonne que pour moi!

PS: Lorsque j'aurais du temps, je peaufinerais mes petits utilitaires
fait sur le moment, ils sont très pratiques et facilement adaptables et
finalement plus rapides que recover. Seul souci, c'est fondé sur la
nonfragmentation des fichiers... :(. Ca doit s'adapter pour des fichiers
textes mais pour les gros fichiers d'archives, c'est rappé. Par contre
avantage +++, ça doit marcher sur ext3 et autres...

François Boisson

--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact

Aux Saveurs Gourmandes

11/06/2005 à 17:50

François Boisson a écrit :

PS: Lorsque j'aurais du temps, je peaufinerais mes petits utilitaires

a ta place d'es que j'ai le temps je met en place une procedure de
backup serieurse !!!
Guy

--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact

Bêtise et récupération de fichiers

6 réponses

Veuillez sélectionner un problème