Programme open source de création de PDF lisible
Répondre à la discussion
Affichage des résultats 1 à 11 sur 11

Programme open source de création de PDF lisible



  1. #1
    Geb

    Programme open source de création de PDF lisible


    ------

    Bonsoir,

    Je télécharge parfois des fichiers PDF de vieux bouquins très volumineux et très peu connus. Il m'arrive parfois de passer les images des pages du PDF dans un OCR gratuit, afin de transcrire le texte dans un document à part.

    Aujourd'hui, j'aimerais passer à l'étape suivante et tenter de superposer le texte corrigé dans le document, à son image de texte dans le document PDF. Est-il possible de faire ça avec un logiciel open source ? Si oui, quel programme me conseilleriez-vous ?

    En outre, en espérant être assez clair, pour les PDF déjà "lisibles" de vieilles publications (c'est-à-dire ceux qui permettent d'effectuer un copier-coller du texte directement dans le PDF), qui contiennent parfois de nombreuses erreurs, serait-il possible de corriger le texte de ce que j'appelle un PDF "lisible" ? Si oui, avec quel programme open source ?

    Cordialement.

    -----
    Dernière modification par Geb ; 10/11/2020 à 23h49.

  2. #2
    umfred

    Re : Programme open source de création de PDF lisible

    peut-être voir avec inkscape ou libre office (draw ou writer)

  3. #3
    tchitchou

    Re : Programme open source de création de PDF lisible

    Bonjour à tous,
    techniquement, pas de souci pour poser du texte par dessus une image,
    avec un traitement de texte, soit en mettant l'image en "filigrane", soit en empilant les objets ; texte et image, (avec l'image dessous).

    Inkscape peut aussi, mais n'étant pas fait pour ça, je suis moins sûr du ratio temps passé/résultat.
    (une nuance aussi, Inkscape, qu'on me corrige si je me trompe, un document enregistré, c'est une page, pas plusieurs)

    Mais surtout.. le résultat va être un scan pas forcément noir sur blanc blanc, et tu veux ajouter du texte par dessus, pas sûr que ce soit très agréable à utiliser/lire.

    Je te conseillerais de faire un essai rapide avec Writer ou un logiciel de traitement photo genre photofiltre pour te faire une idée du résultat.
    Dernière modification par tchitchou ; 12/11/2020 à 11h59.

  4. #4
    Janpolanton

    Re : Programme open source de création de PDF lisible

    Bonjour,
    Comme suggéré plus haut, LibreOffice Draw sait le faire

  5. A voir en vidéo sur Futura
  6. #5
    Geb

    Re : Programme open source de création de PDF lisible

    Bonjour,

    Bien. Je vous remercie pour vos suggestions. Pour vous donner un peu plus de contexte, j'aimerais pouvoir faire un copier-coller du texte d'un vieux bouquin (par exemple celui-ci) directement dans le PDF, en ayant eu le loisir de corriger les éventuelles erreurs de l'OCR. A la fois pour avoir la possibilité de créer un "audiobook maison", mais aussi pour pouvoir effectuer une recherche mot-à-mot en plein texte.

    Pour effectuer la reconnaissance automatique de caractère, j'utilisais jusqu'ici le logiciel FreeOCR de Softy. Il commet tout de même beaucoup d'erreurs et demande quand même beaucoup de temps pour un ouvrage de 700 pages comme celui cité en exemple ci-dessus.

    Par conséquent, j'ai essayé hier la version gratuite du logiciel PDF XChange Editor. Elle permet d'effectuer un OCR relativement correct en relativement peu de temps (environ 11 à 12 secondes par page). Le problème de ce logiciel (en tout cas dans sa version open source), c'est qu'il ne permet pas, à ma connaissance, de corriger l'OCR de ses (toujours nombreuses) erreurs directement dans le PDF.

    Peut-être qu'en ayant le PDF OCR-iser en filigrane avec PDF XChange Editor, je peux ensuite l'ouvrir avec LibreOffice Draw et changer le texte en filigrane ? J'essayerai ça ce soir.

    Cordialement.
    Dernière modification par Geb ; 12/11/2020 à 12h16.

  7. #6
    umfred

    Re : Programme open source de création de PDF lisible

    ce qui est étrange dans ta demande, c'est que tu demandes un programme open-source, alors que PDF XChange Editor n'est pas du tout open source; il y a une version gratuite de démo (qui génère en plus un filigrane (ou watermark) si on utilise les fonctionnalités licenciées)

    gratuit ne veut pas dire dire open source ni l'inverse d'ailleurs. open source indique que l'on peut avoir accès aux sources du programme.

  8. #7
    Geb

    Re : Programme open source de création de PDF lisible

    Citation Envoyé par umfred Voir le message
    ce qui est étrange dans ta demande, c'est que tu demandes un programme open-source, alors que PDF XChange Editor n'est pas du tout open source; il y a une version gratuite de démo (qui génère en plus un filigrane (ou watermark) si on utilise les fonctionnalités licenciées)

    gratuit ne veut pas dire dire open source ni l'inverse d'ailleurs. open source indique que l'on peut avoir accès aux sources du programme.
    Merci pour ces précisions. Effectivement, c'est un des nombreux domaines dans lesquels je ne sais pas du tout de quoi je parle. Tu m'as démasqué !

    C'est vrai qu'il n'est pas open source. Je cherche juste un logiciel gratuit qui fait plus ou moins le job. Et il se trouve que la version gratuite permet la fonction OCR "basique" qui intègre juste un texte plus ou moins correcte sur l'image des pages du PDF, qui ne semble pas générer de watermark.

    J'ai aussi trouvé par hasard cet article à propos d'outils open source qui seraient intéressants. Mais pdfsandwich me semble uniquement fonctionner sur Linux ou Mac (j'ai Windows 10).

    Cordialement.
    Dernière modification par Geb ; 12/11/2020 à 13h29.

  9. #8
    tchitchou

    Re : Programme open source de création de PDF lisible

    L'exemple donné (fichier alice) sur le site de pdfsandwich est bluffant et exactement ce que tu veux faire. (si j'ai bien compris ta demande)

    À ta place, je partirais là dessus, avec un vieil ordi sous linux, ou une session live (sans installation) sur ton ordi..

  10. #9
    umfred

    Re : Programme open source de création de PDF lisible

    ou sur une VM (machine virtuelle)

  11. #10
    Geb

    Re : Programme open source de création de PDF lisible

    Citation Envoyé par tchitchou Voir le message
    À ta place, je partirais là dessus, avec un vieil ordi sous linux, ou une session live (sans installation) sur ton ordi..
    Cela me semble une solution un peu radicale. Il n'y a vraiment aucune alternative à pdfsandwich qui serait à la fois gratuite et compatible avec Windows 10 ? Je vais déjà essayer de modifier un document OCR-isé avec LibreOffice Draw, on verra ce que ça donne. Je garde l'idée d'une session sous Linux, mais vraiment en dernier recours.

    Cordialement.

  12. #11
    tchitchou

    Re : Programme open source de création de PDF lisible

    Ben, le sandwich semble fonctionner, l'exemple alice.pdf, en tout cas est nickel, avec chaque paire de mots aux mêmes endroits à l'image, cf ma photo d'écran.
    Du coup, avec une recherche, tu trouves le mot directement à son emplacement sur le scan.

    Et comme le propose umfred que je salue-salut, ça peut aussi se faire avec une machine virtuelle tournant dans ton W10.
    Images attachées Images attachées  

Discussions similaires

  1. Création d'un poste à souder à l'arc (EE) Open-Source
    Par invite4b7c365f dans le forum Électronique
    Réponses: 24
    Dernier message: 14/03/2013, 19h21
  2. GPU open-source
    Par invitefa0c54f0 dans le forum Électronique
    Réponses: 1
    Dernier message: 21/02/2012, 21h20
  3. Création CPU open-source
    Par invitefa0c54f0 dans le forum Électronique
    Réponses: 6
    Dernier message: 15/02/2012, 10h46
  4. Logiciel de graphiques source libre (open source)
    Par inviteb55e233c dans le forum Logiciel - Software - Open Source
    Réponses: 1
    Dernier message: 25/07/2006, 16h36
Dans la rubrique Tech de Futura, découvrez nos comparatifs produits sur l'informatique et les technologies : imprimantes laser couleur, casques audio, chaises gamer...