[Toulibre] OCR

Lun 5 Sep 08:33:53 CEST 2011

Le 04/09/2011 15:59, Guillaume Betous a écrit :
>
>     http://lucien.dodin.org/luciendodin-free/feuilles_volantes/feuilles0003.PDF
>
>
> alors là au temps pour moi, il est clair que c'est bien okular (celui 
> que j'ai sous la main) qui fait de l'OCR ! et en plus c'est instantané !
>
> on n'arrête plus le progrès ;)
>
> gUI
>
> -- 
> Pour la santé de votre ordinateur, préférez les logiciels libres.
> Lire son mail : http://www.mozilla-europe.org/fr/products/thunderbird/
> Browser le web : http://www.mozilla-europe.org/fr/products/firefox/
> Suite bureautique : http://fr.openoffice.org/
>
>
> _______________________________________________
> Toulouse-ll mailing list
> Toulouse-ll at toulibre.org
> http://toulibre.org/cgi-bin/mailman/listinfo/toulouse-ll
>    

Bonjour,

Contrairement à ce que ce fil affirme okular ne comporte aucun 
dispositif intégré d'OCR et la seule raison qui explique la possibilité 
d'y "copier du texte" à partir du fichier de jdd c'est que ce fichier en 
lui-même, produit par un logiciel propriétaire "Canon", ait dans son 
source sous-jascent à l'image des parties en mode caractère.
Celà peut être le cas de résultats de scans en pdf obtenus avec d'autres 
outils, le pdf ayant évolué d'une catégorie particulière de postscript 
vers une encapsulation de toutes sortes de médias ; en aucun cas celà 
permet d'imaginer qu'un outil libre tel qu'okular ou autre ait encore la 
capacité quand on lui demande de convertir en caractères un bloc 
graphique ; l'ocr c'est justement un des points faibles des oultils 
libres malheureusement, notamment du fait que pas mal d'algorythmes 
soient hyper-protégés dans ce domaine et fasse l'objet d'une concurrence 
effreinée.
Quelques infos ici :
http://lea-linux.org/documentations/index.php/Logith%C3%A8que:OCR

@+

Philippe