[Toulibre] Modification d'un texte dans un fichier ".pdf"

Sylvain sylvain-liste at marliere.org
Sam 7 Jan 04:02:00 CET 2012


Bonjour Henri,

A ma connaissance, aucun logiciel (déjà cité ou non) ne permet de faire 
l'opération que vous souhaitez, à savoir modifier directement du texte 
dans un PDF en conservant la mise en page. Normal, puisque la mise en 
page dépend du logiciel éditeur initial du document (avant son export en 
PDF). Si quelqu'un peut me démentir, je serais très intéressé par la 
solution !

A partir de là, je suggère ces solutions:

- Obtenir le document initial :)
Le document est peut-etre sur le Web, avez-vous essayé dans Google:
"Partie du titre du document entre guillemets" filetype:doc
Ou avec filetype:rtf ou filetype:odt ?
(Cf http://www.googleguide.com/advanced_operators.html )

- Convertir tout le document PDF en texte avec la commande pdftotext.
Cela ne marchera que si le texte du PDF n'est pas vectorisé.
Si vous pouvez surligner le texte a la souris (dans Xpdf, Evince, 
Acrobat, ...) c'est que ce n'est pas vectorisé.
Ensuite vous pourrez corriger le texte librement, mais il vous faudra 
refaire la mise en page de tout le document dans un éditeur (LibreOffice 
par exemple) pour avoir l'ensemble du document avec une mise en page 
uniformisée. Pour 300 pages ca peut etre chaud, mais jouable s'il n'y a 
pas trop de sections (nombre de titres/sous-titres) ni trop de mises en 
forme locales (gras, souligné, texte couleur).

- Ne faire la procédure ci-dessus que pour les quelques pages à corriger.
Il faudra extraire et réintégrer ces pages avec la commande pdftk.
L'inconvénient ici est que la mise en page de vos pages corrigées risque 
de différer de celle des autres pages du document initial (polices, 
couleurs, marges...). Ca me parait jouable.

- Convertir les pages à corriger en image et éditer par copier/coller.
Il faudra utiliser pdftk pour extraire les pages utiles, puis la 
commande pdftoppm pour convertir les pages en pages-images, puis un 
éditeur de dessin (typiquement: Gimp) pour corriger/recomposer les 
phrases en mode 100% dessin (par copier/coller des lettres/mots).
Le plus difficile sera de maintenir l'alignement des mots sur les 
lignes. Ensuite il suffit de sauver les pages au format PNG (indexé ou 
niveaux-de-gris) et d'exporter en PDF (commande sam2p) puis de 
réintégrer les pages avec pdftk.
L'avantage est que vous aurez une mise en forme originale (même police, 
couleur, etc...). C'est jouable aussi (si pas trop de corrections).

- Edition de type "correcteur liquide" et ré-écriture
Vous pouvez tenter de faire cette dernière solution avec pdfedit, en 
ajoutant des rectangles blancs pour couvrir les erreurs à corriger 
(Blanco Tipp-Ex...) puis taper du texte par-dessus. Mais il y a des 
chances que vous ne puissiez pas reproduire la police et la taille de 
caractères originales, alors que la solution précédente (avec 
Copier/Coller Gimp), bien que plus lente, le permet.
Note: pdfedit ou pdftops+flpsed+ps2pdf sont 2 outils supers pour le 
remplissage de formulaire PDF (en particulier ces satanés formulaires 
administratifs scannés).

Si vous avez besoin d'aide technique spécifique sur ces points, vous 
pouvez me contacter directement par msn, yahoomsg, gtalk, icq, irc (ou 
autres). Dans ce cas, envoyez-moi votre contact à mon adresse mail.

Cdlt
-Sylvain

= Debian / Linux 3.1.0-1-686-pae / Fluxbox / Eeepc900 =


---------- Original Message ----------
From: henri.vieilleribiere at free.fr
Sent: Fri, 06 Jan 2012 18:44:01 +0100
To: toulouse-ll at toulibre.org

> Le 06/01/2012 09:09, Henri Vieilleribiere a écrit :
>> Bonjour à tous,
>>
>> Est ce qu'il existe un logiciel qui permet de modifier un texte qui
>> est stocké en .pdf ?
>
> Bonsoir,
> Merci à vous quatre de m'avoir répondu.
> Le .pdf que je veux modifier est constitué uniquement par du texte mis
> en forme. Les corrections concernent l'orthographe et qq. phrases à
> changer de place. (mais il y a 300 pages)
> Sur mon ordi j'ai ubuntu 10.04 et avec Synaptic j'ai installé "pdfedit"
> ça semble s'être bien passé mais je ne sais pas où retrouver les
> commandes pour lancer le logiciel.
> J'ai essayé de voir sur internet mais comme je ne comprends pas
> l'Anglais je n'arrive à rien.
> Si vous pouviez me dire comment on l'ouvre, ça me permettrait de faire
> des essais.
>
> Je vous remercie d'avance.
>
> Henri



Plus d'informations sur la liste de diffusion Toulouse-ll