[Toulibre] OCR

Le J clej37 at gmail.com
Dim 4 Sep 19:07:59 CEST 2011


Bonsoir,

Si vous ne connaissez pas, Il existe aussi l'utilitaire en ligne de commande
"pdftotext <http://en.wikipedia.org/wiki/Pdftotext>" pour extraire du texte
d'un pdf. Je ne l'ai pas trop utilisé mais je viens de le tester sur

> http://lucien.dodin.org/luciendodin-free/feuilles_volantes/feuilles0003.PDF
>
et il a l'air de donner le même résultat que okular, avec l'avantage d'être
facilement scriptable et plus léger que "tesseract" (qui est utilisé par
gimagereader et qui donne de meilleurs résultats).

Le J.
-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://toulibre.org/pipermail/toulouse-ll/attachments/20110904/54179136/attachment.html>


Plus d'informations sur la liste de diffusion Toulouse-ll