Bonsoir,<br><br>Si vous ne connaissez pas, Il existe aussi l'utilitaire en ligne de commande "<a href="http://en.wikipedia.org/wiki/Pdftotext">pdftotext</a>" pour extraire du texte d'un pdf. Je ne l'ai pas trop utilisé mais je viens de le tester sur<br>

<div class="gmail_quote"><div class="im"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><a href="http://lucien.dodin.org/luciendodin-free/feuilles_volantes/feuilles0003.PDF" target="_blank">http://lucien.dodin.org/luciendodin-free/feuilles_volantes/feuilles0003.PDF</a><br>

</blockquote><div>et il a l'air de donner le même résultat que okular, avec l'avantage d'être facilement scriptable et plus léger que "tesseract" (qui est utilisé par gimagereader et qui donne de meilleurs résultats).<br>

<br>Le J.<br><br><br></div><div><br> </div></div></div>