[Toulibre] Modification d'un texte dans un fichier ".pdf"
Sylvain
sylvain-liste at marliere.org
Sam 7 Jan 04:02:00 CET 2012
Bonjour Henri,
A ma connaissance, aucun logiciel (déjà cité ou non) ne permet de faire
l'opération que vous souhaitez, à savoir modifier directement du texte
dans un PDF en conservant la mise en page. Normal, puisque la mise en
page dépend du logiciel éditeur initial du document (avant son export en
PDF). Si quelqu'un peut me démentir, je serais très intéressé par la
solution !
A partir de là, je suggère ces solutions:
- Obtenir le document initial :)
Le document est peut-etre sur le Web, avez-vous essayé dans Google:
"Partie du titre du document entre guillemets" filetype:doc
Ou avec filetype:rtf ou filetype:odt ?
(Cf http://www.googleguide.com/advanced_operators.html )
- Convertir tout le document PDF en texte avec la commande pdftotext.
Cela ne marchera que si le texte du PDF n'est pas vectorisé.
Si vous pouvez surligner le texte a la souris (dans Xpdf, Evince,
Acrobat, ...) c'est que ce n'est pas vectorisé.
Ensuite vous pourrez corriger le texte librement, mais il vous faudra
refaire la mise en page de tout le document dans un éditeur (LibreOffice
par exemple) pour avoir l'ensemble du document avec une mise en page
uniformisée. Pour 300 pages ca peut etre chaud, mais jouable s'il n'y a
pas trop de sections (nombre de titres/sous-titres) ni trop de mises en
forme locales (gras, souligné, texte couleur).
- Ne faire la procédure ci-dessus que pour les quelques pages à corriger.
Il faudra extraire et réintégrer ces pages avec la commande pdftk.
L'inconvénient ici est que la mise en page de vos pages corrigées risque
de différer de celle des autres pages du document initial (polices,
couleurs, marges...). Ca me parait jouable.
- Convertir les pages à corriger en image et éditer par copier/coller.
Il faudra utiliser pdftk pour extraire les pages utiles, puis la
commande pdftoppm pour convertir les pages en pages-images, puis un
éditeur de dessin (typiquement: Gimp) pour corriger/recomposer les
phrases en mode 100% dessin (par copier/coller des lettres/mots).
Le plus difficile sera de maintenir l'alignement des mots sur les
lignes. Ensuite il suffit de sauver les pages au format PNG (indexé ou
niveaux-de-gris) et d'exporter en PDF (commande sam2p) puis de
réintégrer les pages avec pdftk.
L'avantage est que vous aurez une mise en forme originale (même police,
couleur, etc...). C'est jouable aussi (si pas trop de corrections).
- Edition de type "correcteur liquide" et ré-écriture
Vous pouvez tenter de faire cette dernière solution avec pdfedit, en
ajoutant des rectangles blancs pour couvrir les erreurs à corriger
(Blanco Tipp-Ex...) puis taper du texte par-dessus. Mais il y a des
chances que vous ne puissiez pas reproduire la police et la taille de
caractères originales, alors que la solution précédente (avec
Copier/Coller Gimp), bien que plus lente, le permet.
Note: pdfedit ou pdftops+flpsed+ps2pdf sont 2 outils supers pour le
remplissage de formulaire PDF (en particulier ces satanés formulaires
administratifs scannés).
Si vous avez besoin d'aide technique spécifique sur ces points, vous
pouvez me contacter directement par msn, yahoomsg, gtalk, icq, irc (ou
autres). Dans ce cas, envoyez-moi votre contact à mon adresse mail.
Cdlt
-Sylvain
= Debian / Linux 3.1.0-1-686-pae / Fluxbox / Eeepc900 =
---------- Original Message ----------
From: henri.vieilleribiere at free.fr
Sent: Fri, 06 Jan 2012 18:44:01 +0100
To: toulouse-ll at toulibre.org
> Le 06/01/2012 09:09, Henri Vieilleribiere a écrit :
>> Bonjour à tous,
>>
>> Est ce qu'il existe un logiciel qui permet de modifier un texte qui
>> est stocké en .pdf ?
>
> Bonsoir,
> Merci à vous quatre de m'avoir répondu.
> Le .pdf que je veux modifier est constitué uniquement par du texte mis
> en forme. Les corrections concernent l'orthographe et qq. phrases à
> changer de place. (mais il y a 300 pages)
> Sur mon ordi j'ai ubuntu 10.04 et avec Synaptic j'ai installé "pdfedit"
> ça semble s'être bien passé mais je ne sais pas où retrouver les
> commandes pour lancer le logiciel.
> J'ai essayé de voir sur internet mais comme je ne comprends pas
> l'Anglais je n'arrive à rien.
> Si vous pouviez me dire comment on l'ouvre, ça me permettrait de faire
> des essais.
>
> Je vous remercie d'avance.
>
> Henri
Plus d'informations sur la liste de diffusion Toulouse-ll