|
Re : Garder une image de fond avec ocr
Bonsoir Bicou13,
Pas très claire ta question !
Le texte dont tu parles, où se trouve-t-il ?
Garder une image de fond ?
S'il est posé sur la photo, un logiciel d'OCR aura bien des difficultés à traiter cela car comment lui faire comprendre qu'il doit traiter du texte (ça, c'est facile !) et EN MEME temps, et au MEME ENDROIT, il doit traiter une image ?
Pour ces logiciels, dans une zone, une surface délimitée, il y a soit du texte, soit une image. Si c'est une image, le logiciel d'OCR ne "verra" pas le texte, mais juste une ensemble de pixels qui composent l'image.
Pour récupérer les deux, tu devras faire deux reconnaissances, l'une pour le texte, l'autre pour l'image.
Il suffit de scanner 2 fois la page puis de trier les éléments de chacune des pages. Sur une copie tu choisis de traiter la zone comme une image et sur l'autre copie, tu délimites une zone contenant le texte que tu veux lui faire reconnaitre.
Mais il faudra tenir compte des contraste car ton logiciel d'OCR peut éprouver des difficultés à trouver le texte si l'image qui se trouve derrière lui est fort contrasté ou contient beaucoup de détails très marqués.
Tu auras, à la fin du traitement 2 morceaux de documents, mais l'image contiendra toujours le texte. Pour faire disparaitre ce texte, il faudra retoucher l'image (Gimp, photoshop, ...) pour effacer le texte incrusté.
Une image de fond peut être une image placée en filigrane dans un document de traitement de texte, ou placée dans la zone "entête et pied de page" dans word, par exemple.
C'est peut-être également une image avec un texte en sur-impression.
A+
__________________
Cogito ergo sum !
Dernière modification par JPL 23/11/2007 à 20h14.
|