Renommer un pdf en fonction du contenu
Répondre à la discussion
Affichage des résultats 1 à 6 sur 6

Renommer un pdf en fonction du contenu



  1. #1
    invitefe02ba98

    Renommer un pdf en fonction du contenu


    ------

    Bonjour à tous.

    Je souhaiterai renommer des pdf par une ligne de contenu du fichier.
    Ces pdf ont été scanné et indexé.

    Quelqu'un connaitrait une technique pour le faire ? C'est a dire que je donne la zone ou je veux qu'il prenne le texte et je le met en nom de fichier. Et il le fait pour 200 fichiers...

    Je ne sais pas si ça existe ? sinon dans quel langage de programmation est ce possible ?

    Merci beaucoup pour les pistes apportées.

    -----

  2. #2
    Cyrille999

    Re : Renommer un pdf en fonction du contenu

    Bonjour tomastock,

    Oui, tu peux le faire. Avec n'importe quelle langage, d'ailleurs. Ca, c'est en théorie (le PDF, c'est un format standard, tu dois pouvoir y extraire du contenu).

    En pratique, il faut te trouver un langage qui te convient, et surtout qui pourrait possèder des bibliothèques de lecture de format de PDF, pour ne pas avoir à le faire (en plus, c'est assez complexe, car il y a plusieurs versions, donc il faut traiter, etc...)

    C'est quoi ton langage de prédilection ?

    Cyrille
    La connaissance est la matière première de l'Intelligence.

  3. #3
    Jack
    Modérateur

    Re : Renommer un pdf en fonction du contenu

    Le problème, c'est que les documents ont été scannés. Il va donc falloir utiliser un OCR pour analyser les images et les convertir en texte. Ca rend la tâche beaucoup plus compliquée malheureusement.

    Peut-être existe-t-il des bibliothèques libres permettant de faire de l'ocr.

    A+

  4. #4
    invitefe02ba98

    Re : Renommer un pdf en fonction du contenu

    Merci pour ces réponses.

    J'ai déjà indexé mes PDFs par OCR. Je peux donc sélectionner le texte...

    Je pensais que ce genre d'application devait se trouver assez facilement mais en fait pas du tout. Des sociétés vendent des logiciels ainsi (on leur donne un exemplaire pdf et ils donnent le programme qui rempli un fichier excel à partir de millier de pdf... 15000 euro...).

    Je connais un peu java pour faire du calcul par élément fini et la visualisation qui en découlait mais jamais de la manipulation de fichier.

    Pensez vous qu'on peut transformer tout le texte du pdf et s'en servir dans java pour rechercher les lettres qui suivent "Numero de client:" par exemple et les récupérer ?

    Merci

  5. A voir en vidéo sur Futura
  6. #5
    Jack
    Modérateur

    Re : Renommer un pdf en fonction du contenu

    j'ai trouvé ceci;
    http://www.phpcs.com/tutoriaux/EXTRA...F-PDF_799.aspx

    il y a du boulot en perspective ...

    A+

  7. #6
    Cyrille999

    Re : Renommer un pdf en fonction du contenu

    Citation Envoyé par tomastock Voir le message
    Merci pour ces réponses.

    J'ai déjà indexé mes PDFs par OCR. Je peux donc sélectionner le texte...

    Je pensais que ce genre d'application devait se trouver assez facilement mais en fait pas du tout. Des sociétés vendent des logiciels ainsi (on leur donne un exemplaire pdf et ils donnent le programme qui rempli un fichier excel à partir de millier de pdf... 15000 euro...).

    Je connais un peu java pour faire du calcul par élément fini et la visualisation qui en découlait mais jamais de la manipulation de fichier.

    Pensez vous qu'on peut transformer tout le texte du pdf et s'en servir dans java pour rechercher les lettres qui suivent "Numero de client:" par exemple et les récupérer ?

    Merci
    Super !

    Jack m'avait bloqué dans sa réponse, heureusement que tu as eu de la suite dans les idées; Les images auraient été intraitables.

    Jack t'a donné un bout de code en php.

    Si tu as besoin de plus d'aide en un autre langage, vas sur le site développez.com:
    http://www.developpez.com/

    C'est LE site de référence des développeurs. Vu que Java propose plusieurs outils de développements EDI (dont le très puissant et gratuit Eclipse), donc plusieurs bibliothèques standard, aussi, je ne sais, mais ça serait étonnant qu'il n'existe pas des bibliothèques de traitement de fichiers PDF et d'entrées-sorties de fichiers sous WINDOWS.
    http://java.developpez.com/
    ou le forum:
    http://www.developpez.net/forums/f6/java/

    Cyrille
    La connaissance est la matière première de l'Intelligence.

Discussions similaires

  1. renommer le Compte utilisateur
    Par ABN84 dans le forum Logiciel - Software - Open Source
    Réponses: 0
    Dernier message: 24/10/2009, 15h42
  2. renommer un DD ou une partition
    Par Fistos dans le forum Matériel - Hardware
    Réponses: 7
    Dernier message: 26/09/2006, 16h40
  3. Renommer un PC
    Par black templar dans le forum Logiciel - Software - Open Source
    Réponses: 5
    Dernier message: 15/07/2006, 15h06
  4. renommer un lien internet
    Par invited064bf1a dans le forum Logiciel - Software - Open Source
    Réponses: 8
    Dernier message: 04/02/2006, 19h38
Dans la rubrique Tech de Futura, découvrez nos comparatifs produits sur l'informatique et les technologies : imprimantes laser couleur, casques audio, chaises gamer...