problème avec locales

Le
Klaus Becker
Salut,

j'utilise KDE 4.2 sur Lenny.

Je crée avec OOo un petit fichier avec des accents français, et j=
'en fais
ensuite un fichier pdf. Problème : les lettres comme é,à,Ã=
§ etc sont affichées
comme ���.

J'ai testé pls config de locales, par ex. :

# dpkg-reconfigure locales
Generating locales (this might take a while)
fr_FR.ISO-8859-1 done
fr_FR.UTF-8 done
fr_FR.ISO-8859-15@euro done
fr_FR.UTF-8 done
Generation complete.

Quelque soit la config de locales choisie, mon problème est tjs lÃ=
 , alors que
par ex dans "konsole", l'affichage est correcte.

Est-ce que le problème vient de pdftotext ? Que puis-je faire ?

bonne soirée

Klaus

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to debian-user-french-REQUEST@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
jeep-ml
Le #18879801
>>>> "KB" <=> Klaus Becker









Le(On) Wed, 11 Mar 2009 20:19:52 +0100,
Klaus Becker écrivait(wrote) :


KB> Salut,
'soir,

KB> j'utilise KDE 4.2 sur Lenny.

KB> Je crée avec OOo un petit fichier avec des accents français,
KB> et j'en fais ensuite un fichier pdf. Problème : les lettres
KB> comme é,à,ç etc sont affichées comme

Mais ... elles sont affichées ainsi *dans le pdf* ?
Tu parles plus bas de 'pdftotext', alors c'est dans le fichier texte
après « conversion » ?
[bon, je pars de ce principe]

[...]
KB> fr_FR.ISO-8859-1... done fr_FR.UTF-8... done
KB> done fr_FR.UTF-8... done
KB> Generation complete.

Ça à l'air OK, ça.

KB> Quelque soit la config de locales choisie, mon problème est
KB> tjs là, alors que par ex dans "konsole", l'affichage est
KB> correcte.

Mais avec KDE, il me semble que les pblms sont « récupérés » par
icelui.

KB> Est-ce que le problème vient de pdftotext ? Que puis-je faire
KB> ?

Je ne connais pas 'pdftotext' ... mais tu peux récupérer des
fichiers *texte* mal encodés avec 'iconv', par exemple ('recode'
aussi, mais je le connais moins).

Cela dit, je ne suis pas sûr que ce soit ce que tu désires, je n'ai
pas bien compris quel devait être le format final.

Pour récupérer ton fichier, vérifier l'encodage de celui-ci, puis
convertir :
$ file mon_fichier.txt
mon_fichier.txt: UTF-8 Unicode text
Puis :
iconv -f UTF-8 -t ISO8859-1 -o nouveau_fichier.txt mon_fichier.txt

Pour (un exemple, donc) convertir un fichier 'mon_fichier.txt'
encodé en UTF-8 en un nouveau fichier 'nouveau_fichier.txt', encodé
en iso8859-1.

Pour avoir la liste (et la façon d'écrire, donc) des locales :
$ iconv --list

Sinon, je vois dans le 'man' de 'pdftotext' :
[...]
-enc encoding-name
Sets the encoding to use for text output. The encoding-name
must be defined with the unicodeMap command
(see xpdfrc(5)). The encoding name is case-sensitive.
This defaults to "Latin1" (which is a built-in encoding).
[config file: textEncoding]
[...]

Apparemment il encode par défaut en iso8859-1, donc si tu es en
UTF-8 (et si j'ai bien compris ta manip'), ça peut effectivement
expliquer les dégâts.

HTH,

KB> bonne soirée

Merci, toi aussi ! ;)

Jeep.

--
Banquier : Homme secourable qui vous prête un parapluie quand il
fait beau, et qui vous le réclame dès qu'il commence à pleuvoir.
-+- René Bergeron -+-

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
jipe
Le #18885321
Klaus Becker a écrit :
Salut,

j'utilise KDE 4.2 sur Lenny.

Je crée avec OOo un petit fichier avec des accents français, et j'en fais
ensuite un fichier pdf. Problème : les lettres comme é,à,ç etc sont affichées
comme ���.

J'ai testé pls config de locales, par ex. :

# dpkg-reconfigure locales
Generating locales (this might take a while)...
fr_FR.ISO-8859-1... done
fr_FR.UTF-8... done
done
fr_FR.UTF-8... done
Generation complete.

Quelque soit la config de locales choisie, mon problème est tjs là, alors que
par ex dans "konsole", l'affichage est correcte.

Est-ce que le problème vient de pdftotext ? Que puis-je faire ?

bonne soirée

Klaus




Salut Klaus,
quelle est ta version de Ooo ? as-tu essayé l'outil propre à Ooo pour
transformer tes .ods en .pdf ?
Je m'en sert souvent et je n'ai pas ce problème.
jpng

--
jipe
Linux 2.6.24-23-generic #1 SMP Mon Jan 26 00:13:11 UTC 2009 i686 GNU/Linux
Description: Ubuntu 8.04.1 Codename: hardy
http://pascaudjipe.free.fr

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Klaus Becker
Le #18885831
On Thursday 12 March 2009 14:34:32 jipe wrote:
Klaus Becker a écrit :
> Salut,
>
> j'utilise KDE 4.2 sur Lenny.
>
> Je crée avec OOo un petit fichier avec des accents français, et j'en fais
> ensuite un fichier pdf. Problème : les lettres comme é,à ,ç etc sont
> affichées comme ���.
>
> J'ai testé pls config de locales, par ex. :
>
> # dpkg-reconfigure locales
> Generating locales (this might take a while)...
> fr_FR.ISO-8859-1... done
> fr_FR.UTF-8... done
> done
> fr_FR.UTF-8... done
> Generation complete.
>
> Quelque soit la config de locales choisie, mon problème est tjs l à, alors
> que par ex dans "konsole", l'affichage est correcte.
>
> Est-ce que le problème vient de pdftotext ? Que puis-je faire ?
>
> bonne soirée
>
> Klaus

Salut Klaus,
quelle est ta version de Ooo ? as-tu essayé l'outil propre à Oo o pour
transformer tes .ods en .pdf ?
Je m'en sert souvent et je n'ai pas ce problème.
jpng



Salut Jipe,

le problème n'est pas OO. Le fichier pdf est bon, c'est le fichier *tx t
résultant de pdftote où je trouve les ���.

je me suis mal exprimé

Klaus

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
jipe
Le #18886251
Klaus Becker a écrit :
On Thursday 12 March 2009 14:34:32 jipe wrote:

Klaus Becker a écrit :

Salut,

j'utilise KDE 4.2 sur Lenny.

Je crée avec OOo un petit fichier avec des accents français, et j'en fais
ensuite un fichier pdf. Problème : les lettres comme é,à,ç etc sont
affichées comme ���.

J'ai testé pls config de locales, par ex. :

# dpkg-reconfigure locales
Generating locales (this might take a while)...
fr_FR.ISO-8859-1... done
fr_FR.UTF-8... done
done
fr_FR.UTF-8... done
Generation complete.

Quelque soit la config de locales choisie, mon problème est tjs là, alors
que par ex dans "konsole", l'affichage est correcte.

Est-ce que le problème vient de pdftotext ? Que puis-je faire ?

bonne soirée

Klaus



Salut Klaus,
quelle est ta version de Ooo ? as-tu essayé l'outil propre à Ooo pour
transformer tes .ods en .pdf ?
Je m'en sert souvent et je n'ai pas ce problème.
jpng




Salut Jipe,

le problème n'est pas OO. Le fichier pdf est bon, c'est le fichier *txt
résultant de pdftote où je trouve les ���.

je me suis mal exprimé

Klaus




ok, capito; mais pourquoi pas faire un fichier .txt directement à partir
du fichier .ods, dans ce cas ?


--
jipe
Linux 2.6.24-23-generic #1 SMP Mon Jan 26 00:13:11 UTC 2009 i686 GNU/Linux
Description: Ubuntu 8.04.1 Codename: hardy
http://pascaudjipe.free.fr/dotclear/index.php?

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Sylvain Sauvage
Le #18886501
jipe, jeudi 12 mars 2009, 16:48:02 CET

Klaus Becker a écrit :
[…]
>>> Je crée avec OOo un petit fichier avec des accents français , et j'en fais
>>> ensuite un fichier pdf. Problème : les lettres comme é,à  ,ç etc sont
>>> affichées comme ���.
[…]
>>> Est-ce que le problème vient de pdftotext ? Que puis-je faire ?
[…]
> le problème n'est pas OO. Le fichier pdf est bon, c'est le fichier *txt
> résultant de pdftote où je trouve les ï¿½ï¿½ï ¿½.
[…]
ok, capito; mais pourquoi pas faire un fichier .txt directement à pa rtir
du fichier .ods, dans ce cas ?



Oui, hein, déjà ;o)

Au passage, générer plusieurs locales ne change strictement
rien : pour qu’un terminal affiche correctement des caractà ¨res,
il faut qu’il soit dans le même charset que ces caractère s (ou
alors le terminal est très malin) ; les locales correspondent aux
messages (discutailles, erreurs…) des programmes, pas aux
charsets, pas aux capacités du terminal.

Bon, donc, tu es en utf-8 (sinon tu ne te plaindrais d’avoir
des ��� mais des é), et le texte gé néré par pdftotext est en
latin9 (ou pas loin). Je vois deux possibilités :
1. le PDF lui-même ne contient que du latin9 (parce que c’est
plus simple que de l’unicode, parce que le texte ne contient
aucun autre caractère donc il colle au plus juste…), et
pdftotext ne donne que ce qu’il voit ;
2. pdftotext fait tout seul la conversion des caractères dans
un charset qui n’est même pas le charset de la locale.

Franchement, pour paraphraser Desproges, le 1. m’étonnerait un
peu, le 2. m’étonnerait quand même beaucoup (surtout que, chez
moi, pdftotext me sort bien de l’utf-8, en partant pourtant d†™un
.tex en latin9).

Quelqu’un a un 3 ?

--
Sylvain Sauvage

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Sylvain Sauvage
Le #18886651
Sylvain Sauvage, jeudi 12 mars 2009, 17:39:16 CET
[…]
(surtout que, chez moi, pdftotext me sort bien de l’utf-8, en
partant pourtant d’un .tex en latin9).



Au fait : j’utilise le pdftotext de poppler-utils, il y en a
un dans xpdf-utils, lequel utilises-tu ?

(poppler est _basé_ sur xpdf, je ne sais pas si ça a divergé ou
pas…)

--
Sylvain Sauvage

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Publicité
Poster une réponse
Anonyme