Découper et rassembler des PDF

Le
Olivier Miakinen
[diapublications dans deux groupes, suivi vers fcolc seul, mais
il vaudrait peut-être mieux choisir fcal -- changez le suivi si
ça vous semble préférable]

Bonjour,

J'ai numérisé des recueils de partitions afin d'en faire des PDF
imprimables pour un ensemble vocal(¹). Le scanner me permet de
numériser les pages deux par deux, et il crée un PDF d'une page
par scan (sauf une fois où, sans que je comprenne pourquoi, il
a mis deux résultats de scan dans un PDF de deux pages).

Bref, pour un recueil de 7 pages, j'obtiens par exemple quatre PDF
contenant ceci :

+-+-+-+
| | | |
| | p1 | |
| | | |
+-+-+-+

+-+-+-+
| | | |
| p2 | p3 | |
| | | |
+-+-+-+

+-+-+-+
| | | |
| p4 | p5 | |
| | | |
+-+-+-+

+-+-+-+
| | | |
| p6 | p7 | |
| | | |
+-+-+-+

Je voudrais alors obtenir un seul PDF de sept pages :

+-+ +-+ +-+ +-+ +-+ +-+ +-+
| | | | | | | | | | | | | |
| p1 | | p2 | | p3 | | p4 | | p5 | | p6 | | p7 |
| | | | | | | | | | | | | |
+-+ +-+ +-+ +-+ +-+ +-+ +-+

Je voudrais savoir ce que vous me conseilleriez, sur Linux, pour le
faire le plus simplement possible. Vu que certains recueils peuvent
avoir beaucoup de pages, si c'était possible avec un outil en ligne
de commande plutôt qu'avec un cliquodrome ce serait encore mieux
(mais si ça n'existe pas, tant pis).

Pour fixer les idées, voici un exemple d'un PDF obtenu en sortie de
numérisation : <http://www.cjoint.com/15mi/EEvxS4BptI5_doc49.pdf>.

Cordialement,
--
Olivier Miakinen

Note (¹) : Pour ceux qui s'en inquièteraient, ce n'est pas illégal. En
effet, l'ensemble vocal a signé une convention avec la SEAM permettant,
avec un abonnement dépendant du nombre de choristes, d'acheter une seule
partition et d'en faire autant de photocopies qu'il y a de choristes :
<http://www.seamfrance.fr/les-conventions/chorales/>.
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses Page 1 / 6
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Philippe
Le #26353745
Le Fri, 22 May 2015 00:19:29 +0200, Olivier Miakinen a écrit :

J'ai numérisé des recueils de partitions afin d'en faire des PDF
imprimables pour un ensemble vocal(¹). Le scanner me permet de numériser
les pages deux par deux, et il crée un PDF d'une page par scan (sauf une
fois où, sans que je comprenne pourquoi, il a mis deux résultats de scan
dans un PDF de deux pages).



Il faut voir la configuration possible du scanner, sinon le plus simple
reste de scanner page par page. C'est la la solution qui limite le temps
de travail total.
Tu as alors 1 pdf par page puis tu assembles avec PDFchain ou PDFsam ou pdftk




--
http://www.assemblee-nationale.fr/histoire/jaures/discours/responsables-guerre_25071914.asp
https://www.youtube.com/watch?v=EUoxRR5aRlI
Philippe Vessaire Ò¿Ó¬
125
Le #26353758
Le 22/05/2015 00:19, Olivier Miakinen a écrit :
[diapublications dans deux groupes, suivi vers fcolc seul, mais
il vaudrait peut-être mieux choisir fcal -- changez le suivi si
ça vous semble préférable]

Bonjour,

J'ai numérisé des recueils de partitions afin d'en faire des PDF
imprimables pour un ensemble vocal(¹). Le scanner me permet de
numériser les pages deux par deux, et il crée un PDF d'une page
par scan (sauf une fois où, sans que je comprenne pourquoi, il
a mis deux résultats de scan dans un PDF de deux pages).

Bref, pour un recueil de 7 pages, j'obtiens par exemple quatre PDF
contenant ceci :

+----+----+-+
| | | |
| | p1 | |
| | | |
+----+----+-+

+----+----+-+
| | | |
| p2 | p3 | |
| | | |
+----+----+-+

+----+----+-+
| | | |
| p4 | p5 | |
| | | |
+----+----+-+

+----+----+-+
| | | |
| p6 | p7 | |
| | | |
+----+----+-+

Je voudrais alors obtenir un seul PDF de sept pages :

+----+ +----+ +----+ +----+ +----+ +----+ +----+
| | | | | | | | | | | | | |
| p1 | | p2 | | p3 | | p4 | | p5 | | p6 | | p7 |
| | | | | | | | | | | | | |
+----+ +----+ +----+ +----+ +----+ +----+ +----+

Je voudrais savoir ce que vous me conseilleriez, sur Linux, pour le
faire le plus simplement possible. Vu que certains recueils peuvent
avoir beaucoup de pages, si c'était possible avec un outil en ligne
de commande plutôt qu'avec un cliquodrome ce serait encore mieux
(mais si ça n'existe pas, tant pis).

Pour fixer les idées, voici un exemple d'un PDF obtenu en sortie de
numérisation :
Cordialement,



Voir

libreoffice draw
xournal
pdfmod

etc...
HD
Le #26353773
Pour ma part, j'utilise PDFSam. Il fusionne, sépare, fait tout un tas
d'action sur les pdf.

@+
HD
franssoa
Le #26353790
Le 22. 05. 15 07:45, Philippe a écrit :
Le Fri, 22 May 2015 00:19:29 +0200, Olivier Miakinen a écrit :

J'ai numérisé des recueils de partitions afin d'en faire des PDF
imprimables pour un ensemble vocal(¹). Le scanner me permet de numériser
les pages deux par deux, et il crée un PDF d'une page par scan (sauf une
fois où, sans que je comprenne pourquoi, il a mis deux résultats de scan
dans un PDF de deux pages).



Il faut voir la configuration possible du scanner, sinon le plus simple
reste de scanner page par page



+1 parce que là, tu as un pdf avec une seule grosse image dedans. C'est
toujours possible de jouer avec les marges, refaire des 1/2 pdf et les
réassembler, mais ça reste du bricolage et tu va y passer plus de temps
que de rescanner page par page.

franssoa
Kevin Denis
Le #26353798
Le 21-05-2015, Olivier Miakinen
Je voudrais savoir ce que vous me conseilleriez, sur Linux, pour le
faire le plus simplement possible. Vu que certains recueils peuvent
avoir beaucoup de pages, si c'était possible avec un outil en ligne
de commande plutôt qu'avec un cliquodrome ce serait encore mieux



Imagemagick sait utiliser le format pdf et peut concaténer/découper
des pdfs.
la commande convert peut en plus utiliser des numéros de page
convert toto.pdf[1,3] page1et3.pdf
--
Kevin
Nicolas George
Le #26353801
Olivier Miakinen , dans le message a écrit :
J'ai numérisé des recueils de partitions afin d'en faire des PDF



Donc ce sont des PDF qui ont chacun une grosse image par page, n'est-ce
pas ? Dans ce cas, le mieux est d'extraire les images (pdfimages -j) et de
les manipuler en tant qu'images.
Lucas Levrel
Le #26353807
Le 22 mai 2015, Olivier Miakinen a écrit :

[diapublications dans deux groupes, suivi vers fcolc seul, mais
il vaudrait peut-être mieux choisir fcal -- changez le suivi si
ça vous semble préférable]



Tu peux aller voir sur fr.comp.text.tex aussi.

Je voudrais savoir ce que vous me conseilleriez, sur Linux, pour le
faire le plus simplement possible. Vu que certains recueils peuvent
avoir beaucoup de pages, si c'était possible avec un outil en ligne
de commande plutôt qu'avec un cliquodrome ce serait encore mieux
(mais si ça n'existe pas, tant pis).



Mettons que tu aies scan1.pdf à scan4.pdf

for i in {1..4}
do pdfcrop --bbox '0 0 500 842' scan$i.pdf page$i_a.pdf
pdfcrop --bbox '500 0 1000 842' scan$i.pdf page$i_b.pdf
done
pdfjoin page*.pdf -o fini.pdf

Si tu as plus de 9 scans tu remplaces la dernière commande par
pdfjoin $(ls -rt page*.pdf) -o fini.pdf

--
LL
Ἕν οἶδα ὅτι οὐδὲν οἶδα (Σωκράτης)
C'est mieux avé les accents (F. Patte)
Nicolas Richard
Le #26353809
Nicolas George
Olivier Miakinen , dans le message a écrit :
J'ai numérisé des recueils de partitions afin d'en faire des PDF



Donc ce sont des PDF qui ont chacun une grosse image par page, n'est-ce
pas ? Dans ce cas, le mieux est d'extraire les images (pdfimages -j) et de
les manipuler en tant qu'images.



Toutafé.

"pdfimages -j fichier-pdf un-joli-nom" va créer des fichiers préfixés
par "un-joli-nom-" (ma version de pdfimages supporte aussi "-all" à la place de
"-j").

Tu peux alors
$ identify un-joli-nom-*"
pour voir la taille de ces bêtes là. Là le fichier faisait 5120x3296
et à vue de pif, puis en ajustant un peu, voici des valeurs qui donnent
qqch de pas délirant :
$ convert un-joli-nom-000.pbm -crop 2050x+0+0 gauche.jpg
$ convert un-joli-nom-000.pbm -crop 2200x+2050+0 droite.jpg

HTH,

--
Nico.
Olivier Miakinen
Le #26353824
Le 22/05/2015 00:19, j'écrivais :

[manipulations de PDF si possible en ligne de commande]



Je vois que vous avez été plusieurs à avoir la gentillesse
de me donner votre avis. Je réponds à ce que je peux (là je
ne suis pas devant mon Linux) puis je répondrai aux autres
quand j'aurai essayé ce que vous me proposez.
Olivier Miakinen
Le #26353823
Bonjour,

Le 22/05/2015 07:45, Philippe m'a répondu :

J'ai numérisé des recueils de partitions afin d'en faire des PDF
imprimables pour un ensemble vocal(¹). Le scanner me permet de numériser
les pages deux par deux, et il crée un PDF d'une page par scan (sauf une
fois où, sans que je comprenne pourquoi, il a mis deux résultats de scan
dans un PDF de deux pages).



Il faut voir la configuration possible du scanner,



J'avoue que je n'ai pas eu trop le temps de chercher toutes ses
fonctionnalités. C'est une photocopieuse qui permet de scanner
et d'envoyer le résultat du scan par courriel, sous la forme
dont j'ai donné un exemple.

sinon le plus simple
reste de scanner page par page. C'est la la solution qui limite le temps
de travail total.



Je peux me tromper, mais je n'y crois pas, du moins s'il existe une
façon d'automatiser le traitement des fichiers.

En effet,
- le positionnement de l'ouvrage sur la glace, puis le scan proprement
dit sont relativement longs en soi, donc si je peux diviser ce
temps par deux c'est un gros gain de temps ;
- devoir positionner une fois sur deux par rapport au bord de l'ouvrage
et une fois sur deux par rapport au milieu complique encore les
choses ;
- aussi, avoir l'ouvrage en partie sur le scanner et en partie en
dehors n'est pas très pratique.

De plus...

Tu as alors 1 pdf par page puis tu assembles avec PDFchain ou PDFsam ou pdftk



... ça ne suffira pas puisque le scanner détecte mal les bords de la
page et qu'il laisse une marge. Il faudra donc de toute façon retailler
le résultat avant d'assembler les différentes pages.

Cordialement,
--
Olivier Miakinen
Publicité
Poster une réponse
Anonyme