Programmation
Répondre à la discussion
Affichage des résultats 1 à 7 sur 7

Programmation



  1. #1
    inviteddefc4b3

    Programmation


    ------

    Bonjour à tous !

    Je souhaiterais savoir s'il est possible de créer un petit programme qui serait capable de remplir seul les métadatas de plusieurs documents...

    Je m'explique... pour améliorer un moteur de recherche et la pertinence des résultats, l'idéal serait entre autres que tous les pdf, .doc, etc. aient de renseigner quelques données dans leur propriété comme le titre, ou la date ou encore l'auteur... à l'heure actuelle, sur la plupart des documents présents sur le serveur que j'utilise, ces champs ne sont pas renseignés lorsque je vérifie ça dans /clique droit/propriétés. Je ne suis pas du tout informaticien, mais je dois m'occuper de ça, et je voulais donc savoir si un génie ici présent saurait si on peut créer un petit programme qui remplirait ces champs-là...

    Merci d'avance !!!

    -----

  2. #2
    inviteddefc4b3

    Re : Programmation

    Personne n'a d'idées ?

  3. #3
    invitea41aab6c

    Re : Programmation

    Bonjour,

    C'est possible, mais encore faudrait-il connaitre la structure des métadonnées pour chaque type de documents.
    Ça nécessite donc quelques recherches... Nul doute ceci dit qu'il existe des outils/biblio déjà conçus pour ça.

    Une fois la structure connue, concevoir un programme capable de lire et modifier ces champs ne nécessite pas un travail de titan..

    Tu devrais t'essayer à quelques recherches. J'ai trouvé ce lien par exemple : http://blog.tuquoque.com/post/2010/01/05/metadata-PDF

    A la fin il parle de freewares destinés à travailler sur les méta de .pdf.

  4. #4
    inviteddefc4b3

    Re : Programmation

    Merci !

    Je vais fouiller ton lien un peu, ça m'a l'air intéressant !

    La recherche dont tu parles, je l'ai déjà un peu débroussaillée... En fait, on a diverses trames de document word ou pdf (j'entends par là que la première page change en fonction du type de doc : étude, compte-rendu réunion etc.). Ce que j'aimerais c'est que :

    - soit je fais une moulinette qui rempli tout
    - soit éventuellement (après mure réflexion), lorsqu'on clique sur "enregistrer sous", on ait les champs de métadonnées à remplir

    Je vais fouiller dans ton lien déjà

    Merci !

  5. A voir en vidéo sur Futura
  6. #5
    invite895675d5

    Re : Programmation

    Le problème des metadonnées c'est qu'elles changent de format selon les documents. Tu vas devoir faire un cas pour chaque format, si vous utilisez beaucoup de formats différent, ça va vite devenir lourd à gérer.

  7. #6
    inviteddefc4b3

    Re : Programmation

    C'est bien le problème auquel je pensais être confronté...

    On utilise que word, pdf principalement... le seul souci c'est que le format de première page change, et je me dis que si le petit soft doit aller piocher les infos, ça va être dur puisqu'elles ne sont pas toujours au même endroit !

  8. #7
    invitea41aab6c

    Re : Programmation

    Citation Envoyé par stiflerbassist Voir le message
    Merci !

    Je vais fouiller ton lien un peu, ça m'a l'air intéressant !

    La recherche dont tu parles, je l'ai déjà un peu débroussaillée... En fait, on a diverses trames de document word ou pdf (j'entends par là que la première page change en fonction du type de doc : étude, compte-rendu réunion etc.). Ce que j'aimerais c'est que :

    - soit je fais une moulinette qui rempli tout
    - soit éventuellement (après mure réflexion), lorsqu'on clique sur "enregistrer sous", on ait les champs de métadonnées à remplir

    Je vais fouiller dans ton lien déjà

    Merci !
    Je ne suis pas sûr d'avoir compris :

    Vous aimeriez référencer dans les métadata la nature de chaque doc, (étude, compte-rende, etc) en plus d'informations tel que 'auteur, date..' ?
    Et vous recherchez un outil qui puisse reconnaitre, selon la première page du document, sa nature, afin de pouvoir la renseigner automatiquement dans les méta ?

    Là effectivement, ça représenterait tout un travail.. C'est du sur mesure.

    Et si de surcroit les infos de première page ne respectent pas, selon leur nature, un formalisme rigoureux, ça devient d'autant plus complexe, et pas forcément fiable à 100%

    Tout dépends des quantités / disparités de formats.

    Si il y en a vraiment beaucoup.. Si c'est vraiment complexe.. J'ai bien peur que quelques tuyaux glanés via un forum ne suffisent pas à transformer la tâche en une simple formalité.

    Y a un moment où c'est plus du ressort d'un professionnel. Ça reste un métier

Discussions similaires

  1. programmation
    Par invitea203830e dans le forum Programmation et langages, Algorithmique
    Réponses: 2
    Dernier message: 22/02/2011, 22h36
  2. programmation
    Par invite1f9136b7 dans le forum Logiciel - Software - Open Source
    Réponses: 0
    Dernier message: 29/05/2009, 18h16
  3. Programmation
    Par invite1dee7ead dans le forum Logiciel - Software - Open Source
    Réponses: 24
    Dernier message: 03/01/2009, 11h48
  4. Programmation
    Par invitef8c2c8db dans le forum Mathématiques du supérieur
    Réponses: 3
    Dernier message: 17/10/2008, 17h40
  5. programmation
    Par invite70772835 dans le forum Électronique
    Réponses: 5
    Dernier message: 06/04/2007, 18h22