Je cherche un utilitaire pour transformer des petits morceaux (citation de 2
à 5 lignes ) dans un ouvrage numerisé au format PDF d'Adobe pour les
transferer dans un fichier Word ( les ouvrages sont des livres numerisés
proposés sur Gallica le serveur de la Bibliotheque Nationale de France )
Est ce plus facile a partir d'un format TIFF? (qui est aussi proposé par
le site BNF)
C'est pas du piratage...juste des citations courtes d'ouvrages anciens
Cette action est irreversible, confirmez la suppression du commentaire ?
Signaler le commentaire
Veuillez sélectionner un problème
Nudité
Violence
Harcèlement
Fraude
Vente illégale
Discours haineux
Terrorisme
Autre
blabla
Le Mon, 5 Jan 2004 22:49:16 +0100, "Angkhana" a
Bonjour a tous
Je cherche un utilitaire pour transformer des petits morceaux (citation de 2 à 5 lignes ) dans un ouvrage numerisé au format PDF d'Adobe pour les transferer dans un fichier Word ( les ouvrages sont des livres numerisés proposés sur Gallica le serveur de la Bibliotheque Nationale de France )
Est ce plus facile a partir d'un format TIFF? (qui est aussi proposé par le site BNF)
Aie... si c'est ce que je pense, tu vas avoir du mal par logiciel ; soit les PDF dont tu parles présentent du "vrai" texte, auquel cas un copier coller vers Word suffit (active l'icone [T] dans Acrobat Reader pour sélectionner le texte) ; soit les PDF ne sont pas autre chose qu'un document unique unissant les images TIFF des différentes pages du livre et là ça ira plus vite de recopier le texte dans Word avec tes mimines ; si tu veux souffrir, tu peux essayer de faire tourner un programme d'OCR sur les TIFF; si tu arrives facilement à une conversion image-> texte rapide, exhaustive et fiable, dépose un brevet et contacte la BNF qui sera vivement intéressée :-)
tu as tant de citations à extraire que tu veuilles automatiser la chose ?
C'est pas du piratage...juste des citations courtes d'ouvrages anciens
c'est parfaitement autorisé; personnellement je suis juste un peu dégoûté qu'on ne puisse diffuser plus librement ces histoires de francophonie en entier, vu leur âge ; on crée son dictateur hein...
Merci Angkana
Le Mon, 5 Jan 2004 22:49:16 +0100, "Angkhana" <spinosi@wanadoo.fr> a
Bonjour a tous
Je cherche un utilitaire pour transformer des petits morceaux (citation de 2
à 5 lignes ) dans un ouvrage numerisé au format PDF d'Adobe pour les
transferer dans un fichier Word ( les ouvrages sont des livres numerisés
proposés sur Gallica le serveur de la Bibliotheque Nationale de France )
Est ce plus facile a partir d'un format TIFF? (qui est aussi proposé par
le site BNF)
Aie... si c'est ce que je pense, tu vas avoir du mal par logiciel ;
soit les PDF dont tu parles présentent du "vrai" texte, auquel cas un
copier coller vers Word suffit (active l'icone [T] dans Acrobat Reader
pour sélectionner le texte) ; soit les PDF ne sont pas autre chose
qu'un document unique unissant les images TIFF des différentes pages
du livre et là ça ira plus vite de recopier le texte dans Word avec
tes mimines ;
si tu veux souffrir, tu peux essayer de faire tourner un programme
d'OCR sur les TIFF; si tu arrives facilement à une conversion image->
texte rapide, exhaustive et fiable, dépose un brevet et contacte la
BNF qui sera vivement intéressée :-)
tu as tant de citations à extraire que tu veuilles automatiser la
chose ?
C'est pas du piratage...juste des citations courtes d'ouvrages anciens
c'est parfaitement autorisé; personnellement je suis juste un peu
dégoûté qu'on ne puisse diffuser plus librement ces histoires de
francophonie en entier, vu leur âge ; on crée son dictateur hein...
Je cherche un utilitaire pour transformer des petits morceaux (citation de 2 à 5 lignes ) dans un ouvrage numerisé au format PDF d'Adobe pour les transferer dans un fichier Word ( les ouvrages sont des livres numerisés proposés sur Gallica le serveur de la Bibliotheque Nationale de France )
Est ce plus facile a partir d'un format TIFF? (qui est aussi proposé par le site BNF)
Aie... si c'est ce que je pense, tu vas avoir du mal par logiciel ; soit les PDF dont tu parles présentent du "vrai" texte, auquel cas un copier coller vers Word suffit (active l'icone [T] dans Acrobat Reader pour sélectionner le texte) ; soit les PDF ne sont pas autre chose qu'un document unique unissant les images TIFF des différentes pages du livre et là ça ira plus vite de recopier le texte dans Word avec tes mimines ; si tu veux souffrir, tu peux essayer de faire tourner un programme d'OCR sur les TIFF; si tu arrives facilement à une conversion image-> texte rapide, exhaustive et fiable, dépose un brevet et contacte la BNF qui sera vivement intéressée :-)
tu as tant de citations à extraire que tu veuilles automatiser la chose ?
C'est pas du piratage...juste des citations courtes d'ouvrages anciens
c'est parfaitement autorisé; personnellement je suis juste un peu dégoûté qu'on ne puisse diffuser plus librement ces histoires de francophonie en entier, vu leur âge ; on crée son dictateur hein...