Bonsoir,
Je télécharge parfois des fichiers PDF de vieux bouquins très volumineux et très peu connus. Il m'arrive parfois de passer les images des pages du PDF dans un OCR gratuit, afin de transcrire le texte dans un document à part.
Aujourd'hui, j'aimerais passer à l'étape suivante et tenter de superposer le texte corrigé dans le document, à son image de texte dans le document PDF. Est-il possible de faire ça avec un logiciel open source ? Si oui, quel programme me conseilleriez-vous ?
En outre, en espérant être assez clair, pour les PDF déjà "lisibles" de vieilles publications (c'est-à-dire ceux qui permettent d'effectuer un copier-coller du texte directement dans le PDF), qui contiennent parfois de nombreuses erreurs, serait-il possible de corriger le texte de ce que j'appelle un PDF "lisible" ? Si oui, avec quel programme open source ?
Cordialement.
-----