Codage caractères et zippage :-)

Le
Philippe Delavalade
Bonjour.

Je reçois des fichiers compressés avec winzip d'un ami windowsien ; dans
l'arborescence certains éléments (fichiers ou répertoires) contiennent des
lettres acentuées.

Dans l'arborescence décompressée chez moi avec unzip, les accents restent
corrects ce qui me surprends un peu mais Je précise que ma locale est
fr_FR@euro (Latin9 ou iso-8859-15).

Le simple fait de recompresser avec zip ne change rien comme montré par un
« zip -l ».

Le souci est que lorsque le copain décompresse chez lui avec son winzip,
les noms ont changé (les accents ne sont plus les bons) ; par exemple un
'é' devient 'ü'.

J'ai tendance à penser que le problème vient de winzip mais le copain lui,
incrimine linux ou zip comme fauteurs de trouble.

Quelqu'un aurait-il une explication et surtout un remède ?

Merci d'avance pour vos lumières.

--
Ph. Delavalade

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers debian-user-french-REQUEST@lists.debian.org
En cas de soucis, contactez EN ANGLAIS listmaster@lists.debian.org
Archive: http://lists.debian.org/20130223060642.GA4525@magellan
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses Page 1 / 2
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
moi-meme
Le #25242562
Le Sat, 23 Feb 2013 07:10:01 +0100, Philippe Delavalade a écrit :

J'ai tendance à penser que le problème vient de winzip mais le copain
lui, incrimine linux ou zip comme fauteurs de trouble.



tout à fait en l'air (et newbie) ton copain windozien n'est pas en UTF8 ?

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/51287550$0$2290$
Philippe Delavalade
Le #25242732
Le samedi 23 février à 08:52, moi-meme a écrit :
Le Sat, 23 Feb 2013 07:10:01 +0100, Philippe Delavalade a écrit :

> J'ai tendance à penser que le problème vient de winzip mais le copain
> lui, incrimine linux ou zip comme fauteurs de trouble.

tout à fait en l'air (et newbie) ton copain windozien n'est pas en UTF8 ?



Oops, j'ai répondu à l'expéditeur et pas à la liste :-(

Donc, le copain est peut-être en cp1252 mais je ne suis sûr de rien ; je
lui pose la question dès que possible.

--
Ph. Delavalade

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Bernard Schoenacker
Le #25242772
Le Sat, 23 Feb 2013 10:38:46 +0100,
Philippe Delavalade
Le samedi 23 février à 08:52, moi-meme a écrit :
> Le Sat, 23 Feb 2013 07:10:01 +0100, Philippe Delavalade a écrit :
>
> > J'ai tendance à penser que le problème vient de winzip mais le
> > copain lui, incrimine linux ou zip comme fauteurs de trouble.
>
> tout à fait en l'air (et newbie) ton copain windozien n'est pas en
> UTF8 ?

Oops, j'ai répondu à l'expéditeur et pas à la liste :-(

Donc, le copain est peut-être en cp1252 mais je ne suis sûr de rien ;
je lui pose la question dès que possible.




Bonjour,

Serait il possible avant de "zipper" l'archive d'employer rename
et detox ?

Avantage, cela évite les pb d'encodage au niveau des accents et
d'avoir une salade entre les différents encodages ISO 1252 et
UTF8.

Prière d'essayer de créer une archive tgz et de l'envoyer
à l'utilisateur afin de vérifier qui est le fautif dans cette
histoire ...

slt
bernard

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Philippe Delavalade
Le #25242832
Le samedi 23 février à 11:11, Bernard Schoenacker a écrit :
Serait il possible avant de "zipper" l'archive d'employer rename
et detox ?



Ben non :-) Le copain qui me passe les fichiers ne VEUT pas que je change
les noms ; sinon, effectivement les problèmes seraient réduits.

Prière d'essayer de créer une archive tgz et de l'envoyer
à l'utilisateur afin de vérifier qui est le fautif dans cette
histoire ...



ça c'est sans problème mais quel avantage à utiliser tar -> gzip par
rapport à zip ?

--
Ph. Delavalade

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Bernard Schoenacker
Le #25242912
Le Sat, 23 Feb 2013 11:52:36 +0100,
Philippe Delavalade
Le samedi 23 février à 11:11, Bernard Schoenacker a écrit :
> Serait il possible avant de "zipper" l'archive d'employer
> rename et detox ?

Ben non :-) Le copain qui me passe les fichiers ne VEUT pas que je
change les noms ; sinon, effectivement les problèmes seraient réduits.

> Prière d'essayer de créer une archive tgz et de l'envoyer
> à l'utilisateur afin de vérifier qui est le fautif dans
> cette histoire ...

ça c'est sans problème mais quel avantage à utiliser tar -> gzip par
rapport à zip ?



bonjour,

essayer de faire une archive tar.gz et la même en zip et
comparer ...

GNU tar est plus efficient que zip tout seul

https://fr.wikipedia.org/wiki/Gzip

slt
bernard

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Sébastien NOBILI
Le #25245852
Bonjour,

Le samedi 23 février 2013 à 7:06, Philippe Delavalade a écrit :
Quelqu'un aurait-il une explication et surtout un remède ?



Quelle coïncidence, on en parle justement ce matin au boulot !

Apparemment l'encodage des caractères dans ZIP est problématique, en effet :
http://www.linuxfromscratch.org/blfs/view/6.3/general/unzip.html#unzip-locale-issues

Seb

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Philippe Delavalade
Le #25246462
Le lundi 25 février à 11:17, Sébastien NOBILI a écrit :
Bonjour,

Le samedi 23 février 2013 à 7:06, Philippe Delavalade a écrit :
> Quelqu'un aurait-il une explication et surtout un remède ?

Quelle coïncidence, on en parle justement ce matin au boulot !

Apparemment l'encodage des caractères dans ZIP est problématique, en effet :
http://www.linuxfromscratch.org/blfs/view/6.3/general/unzip.html#unzip-locale-issues



Merci pour l'info. Ça a l'air complexe...

--
Ph. Delavalade

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
nicolas.patrois
Le #25246962
Le 25/02/2013 11:17:49, Sébastien NOBILI a écrit :

Quelle coïncidence, on en parle justement ce matin au boulot !

Apparemment l'encodage des caractères dans ZIP est problématique, en
effet :
http://www.linuxfromscratch.org/blfs/view/6.3/general/
unzip.html#unzip-locale-issues



Ah, ceci explique pourquoi mc fait portnawak avec des fichiers avec des
caractères accentués, au contraire de fileroller.

nicolas patrois : pts noir asocial
--
RÉALISME

M : Qu'est-ce qu'il nous faudrait pour qu'on nous considère comme des
humains ? Un cerveau plus gros ?
P : Non... Une carte bleue suffirait...

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Sébastien NOBILI
Le #25247962
Salut,

Le lundi 25 février 2013 à 20:10, a écrit :
> Apparemment l'encodage des caractères dans ZIP est problématique, en
> effet :
> http://www.linuxfromscratch.org/blfs/view/6.3/general/
> unzip.html#unzip-locale-issues

Ah, ceci explique pourquoi mc fait portnawak avec des fichiers avec des
caractères accentués, au contraire de fileroller.



J'ai passé une bonne partie de ma journée d'hier à creuser le sujet et c'est
assez douloureux.

Les spécifications du format ZIP ont été mises-à-jour pour permettre d'indiquer
(par un flag) lorsque les noms sont exprimés en unicode. Malheureusement, le
support ZIP dans Windows ne gère pas unicode.

Lorsqu'on traite un ZIP (avec le module Perl Archive::Zip dans mon cas), il faut
donc faire de la divination pour déterminer le jeu de caractères. Windows est
censé¹ s'exprimer en Windows-1252, mais dans les archives ZIP, il utilise du
CP850 (jeu de caractères du DOS, on ne change pas une équipe qui gagne !). Là où
ça devient vraiment problématique c'est que ces deux jeux de caractères se
ressemblent étrangement et, toujours dans mon cas, Encode::Detect::Detector se
trompe (à sa décharge, il doit considérer CP850 comme obsolète et n'imagine pas
vraiment avoir affaire à lui).

¹ Par chez nous du moins.

Seb

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Philippe Delavalade
Le #25248242
Le mardi 26 février à 09:42, Sébastien NOBILI a écrit :
J'ai passé une bonne partie de ma journée d'hier à creuser le sujet et c'est
assez douloureux.

Les spécifications du format ZIP ont été mises-à-jour pour permettre d'indiquer
(par un flag) lorsque les noms sont exprimés en unicode. Malheureusement, le
support ZIP dans Windows ne gère pas unicode.

Lorsqu'on traite un ZIP (avec le module Perl Archive::Zip dans mon cas), il faut
donc faire de la divination pour déterminer le jeu de caractères. Windows est
censé¹ s'exprimer en Windows-1252, mais dans les archives ZIP, il utilise du
CP850 (jeu de caractères du DOS, on ne change pas une équipe qui gagne !). Là où
ça devient vraiment problématique c'est que ces deux jeux de caractères se
ressemblent étrangement et, toujours dans mon cas, Encode::Detect::Detector se
trompe (à sa décharge, il doit considérer CP850 comme obsolète et n'imagine pas
vraiment avoir affaire à lui).

¹ Par chez nous du moins.



Bonjour.

La question qui en découle est : est-ce qu'on a les mêmes genres de
problèmes avec d'autres logiciels tels que 7z, xz, bzip ou autres. Et
est-ce que ces logiciels ont une version pour windows ?

Merci pour vos avis.

--
Ph. Delavalade

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Publicité
Poster une réponse
Anonyme