[Toulibre] Modification d'un texte dans un fichier ".pdf"

Eric Guirbal eric.guirbal at gmail.com
Ven 6 Jan 12:30:58 CET 2012


jean cave a écrit :
> libreOffice permet de modifier tout ou  d'un PDF

La modification des pdf dans Draw est possible grâce à l'extension 
pdfimport. Celle-ci n'est probablement pas installée par défaut. Sur une 
Debian - et aussi sur une Ubuntu je suppose - il faut installer le 
paquet libreoffice-pdfimport.

L'extension fonctionne assez bien tant que les modifications sont 
mineures. En revanche pour des modifications plus importantes il vaut 
peut-être mieux extraire le texte du PDF dans un fichier texte et 
ensuite utiliser LibreOffice, LaTeX, Scribus... pour effectuer les 
modifications. Le programme qui permet cette extraction est pdftotext. 
Il faut installer le paquet poppler-utils et dans un terminal saisir la 
commande

pdftotext monfichier.pdf

ou

pdftotext -layout monfichier.pdf

Elle crée le fichier monfichier.txt contenant le texte du pdf avec la 
mise en page respectée autant que possible si l'option -layout est utilisée.

Si le pdf contient des images, la commande pdfimages du même paquet 
poppler-utils permet de les extraire.

pdfimages -j monfichier.pdf mesimages

En sorties: mesimages-001.jpg mesimages-002.ppm mesimages-003.pbm ...

Comme d'habitude, les commandes man pdftotext, et man pdfimages pour une 
documentation complète avec toutes les options disponibles.

Cordialement.

-- 
Éric



Plus d'informations sur la liste de diffusion Toulouse-ll