Répondre à la discussion
Affichage des résultats 1 à 9 sur 9

Code source document



  1. #1
    Hdecharn

    Code source document


    ------

    Bonjour,

    Je souhaiterais savoir comment accéder au code source d'un document texte (par exemple, Word, ou OpenOffice…). Si je ne me trompe, les documents Word, OpenOffice, etc. sont formatés, un peu comme le sont les sites web : le site est codé en HTML, mais nous ne voyons pas ce code, mais plutôt le "code mis en forme" (je précise que j'ai bien mis les guillemets…) ; de même pour un document texte, le logiciel présente le "code mis en forme", et moi, je voudrais accéder à ce "code" (comparaison avec le HTML pour les sites web). Comment dois-je m'y prendre ?
    Merci d'avance pour vos réponses

    -----

  2. Publicité
  3. #2
    PA5CAL

    Re : Code source document

    Bonjour

    Pour lire le code d'un document, il te faut utiliser un éditeur hexadécimal (comme HexEdit ou Hex Fiend, par exemple).

    Si tu veux simplement avoir un aperçu du contenu pour y lire des éléments présents sous forme de texte, tu peux te contenter de l'ouvrir avec TextEdit (dans ce cas, pense surtout à ne pas enregistrer le fichier durant sa consultation).


    Toutefois, contrairement aux pages HTML qui ne contiennent que des "tags" directement compréhensibles par un humain, les fichiers Word sont constués en grande partie de codes non affichables et à la signification sibyline pour qui ne possède pas les spécifications du format. De ce fait, je doute que tu puisses tirer beaucoup partie de l'observation du code de ces documents.

    Pour les fichiers OpenOffice ODT, c'est différent, puisque leur format est bâti sur XML, qui est un langage du même type que HTML, c'est-à-dire humainement lisible. Par contre, ces fichiers sont le plus souvent enregistrés compressés au format ZIP. Pour lire leur contenu, il faut donc commencer par changer l'extension du fichier .ODT en .ZIP, puis dézipper le fichier pour accéder aux fichiers XML sous-jacents.

  4. #3
    PA5CAL

    Re : Code source document

    Oup... Comme je passe d'un forum à l'autre, ici je pensais répondre à un utilisateur de Mac, et j'ai fait une réponse un peu trop spécifique.

    Si tu es sur un PC sous Windows (ce qui est statistiquement plus probable), l'éditeur hexadécimal peut être par exemple HxD ou Hex Editor.

    Et pour l'aperçu du contenu, tu peux utiliser le Bloc-notes de Windows, qui est l'équivalent de TextEdit du Mac.

  5. #4
    Hdecharn

    Re : Code source document

    Merci beaucoup pour ta réponse
    À la base je suis sous Linux, mais je dispose également de Windows…
    Bref, appartee fermée, saurais-tu où je pourrais trouver les spécifications des formats de fichiers associés à ces éditeurs (.doc, .odt, etc.) ?

  6. #5
    PA5CAL

    Re : Code source document

    Une petite recherche sur Internet te permettra d'en trouver la plupart. Par exemple, pour les formats de Microsoft, tu peux aller voir par ici. Pour Open Office, c'est par là (PDF). Etc. ...

  7. A voir en vidéo sur Futura
  8. #6
    Hdecharn

    Re : Code source document

    Merci beaucoup pour toutes ces précisions

  9. Publicité
  10. #7
    JPL

    Re : Code source document

    Attention il y a deux formats pour Word : le format avec l’extension .doc est un format propriétaire qu'il ne faut pas espérer déchiffrer sauf faire de la rétro-ingénierie. Par contre le format .docx plus récent est lui aussi basé sur XML, même si Microsoft n'a pas pu s'empêcher d'y glisser quelques petites spécificité qui s'écartent du format open document odt. Résultat OpenOffice ou (mieux) LibreOffice peuvent lire un docx mais Word ne lit pas un odt !

    C'est très intéressant de dézipper un docx ou un odt.
    Rien ne sert de penser, il faut réfléchir avant - Pierre Dac

  11. #8
    PA5CAL

    Re : Code source document

    Citation Envoyé par JPL Voir le message
    Attention il y a deux formats pour Word : le format avec l’extension .doc est un format propriétaire qu'il ne faut pas espérer déchiffrer sauf faire de la rétro-ingénierie.
    Ce n'est plus vrai.

    À la suite des poursuites pour abus de position dominante et des autres démêlés causés par le manque d'interopérabilité de ses formats, Microsoft s'est finalement vu contraint de publier des spécifications. Elles sont d'ailleurs accessibles en suivant le premier lien que j'ai donné.

    Par exemple, pour les spécifications du format Word binaire « .doc » (Word versions 97, 2000, 2002 et 2003) le document est par ici (PDF, 19Mo).
    Dernière modification par PA5CAL ; 18/05/2012 à 01h22.

  12. #9
    JPL

    Re : Code source document

    C'est bien de le savoir... mais je laisse ces 19 Mo de lecture à d'autres !
    Rien ne sert de penser, il faut réfléchir avant - Pierre Dac

Discussions similaires

  1. Code source
    Par Ekaterina dans le forum Électronique
    Réponses: 5
    Dernier message: 18/03/2011, 18h30
  2. code source
    Par genioura dans le forum Électronique
    Réponses: 9
    Dernier message: 26/03/2010, 23h36
  3. Décryptage de code source JS
    Par Tix dans le forum Logiciel - Software - Open Source
    Réponses: 4
    Dernier message: 07/09/2007, 19h24
  4. Code source du programme
    Par superfd dans le forum Internet - Réseau - Sécurité générale
    Réponses: 3
    Dernier message: 10/04/2003, 21h20