Aide pour Macro VBA sous Excel 2007
Répondre à la discussion
Affichage des résultats 1 à 6 sur 6

Aide pour Macro VBA sous Excel 2007



  1. #1
    invitee4e79868

    Aide pour Macro VBA sous Excel 2007


    ------

    Bonjour à tous!

    Après avoir essayé toute la journée, je suis toujours incapable de faire une seule chose avec VBA (la programmation n'a jamais vraiment été mon truc).
    Alors, voilà, j'ai un unique "gros" fichier texte (47Mo, cela représente pas mal de ligne!), que je dois rapidement analyser. J'ai déjà réussi à mettre au pont sous Excel les fonctions d'analyse, mais pour pouvoir les lancer, il faut "légèrement" remanier la disposition des cellules. J'entends par là des "Concatenate" et des déplacements, donc théoriquement rien de difficile (juste impossible pour moi). J'aurais donc besoin de votre précieuse aide
    Les données que je cherche à analyser représente un total de 800000 lignes (un peu près). Et ce sont des séquences protéiques, pour ceux que cela intéresse. Il y en a normalement un peu moins de 80000, et mon objectif est une ligne=une protéine.
    J’enchaîne ensuite (et cela, je sais faire ), sur un comptage de certains acides aminés dans chaque protéine.
    En exemple :
    >tr|I3L4K7|I3L4K7_HUMAN Nuclear pore complex protein Nup88 (Fragment) OS=Homo sapiens GN=NUP88 PE=4 SV=1
    XIRSILQRSVANPAFLKASEKDIAPPPEEC LQLLSRATQVFREQYILKQDLAKEEIQRRV
    KLLCDQKKKQLEDLSYCREERKSLREMAER LADKYEEAKEKQEDIMNSSL
    >tr|I3L4K8|I3L4K8_HUMAN Carboxylesterase 5A OS=Homo sapiens GN=CES5A PE=4 SV=1
    MSGNWVHPGQILIWAIWVLAAPTKGPSAEG PQRNTRLGWIQGKQVTVLGSPVPVNVFLGV
    PFAAPPLGSLRFTNPQPASPWDNLREATSY PNLCLQNSEWLLLDQHMLKVHYPKFGVSED
    CLYLNIYAPAHADTGSKLPVLVWFPGGAFK TGSASIFDGSALAAYEDVLVVVVQYRLGIF
    GFFTTWDQHAPGNWAFKDQVAALSWVQKNI EFFGGDPSSVTIFGESAGAISVSSLILSPM
    AKGLFHKAIMESGVAIIPYLEAHDYEKSED LQVVAHFCGNNASDSEALLRCLRTKPSKEL
    LTLSQKTKSFTRVVDGAFFPNEPLDLLSQK AFKAIPSIIGVNNHECGFLLPMKEAPEILS
    GSNKSLALHLIQNILHIPPQYLHLVANEYF HDKHSLTEIRDSLLDLLGDVFFVVPALITA
    RYHREGATEEEKLLSRKMMKYWATFARTGN PNGNDLSLWPAYNLTEQYLQLDLNMSLGQR
    LKEPRVEFWTSTIPLILSASDMLHSPLSSL TFLSLLQPFFFFCAP
    Et j'aimerai pouvoir obtenir ceci :
    >tr|I3L4K7|I3L4K7_HUMAN Nuclear pore complex protein Nup88 (Fragment) OS=Homo sapiens GN=NUP88 PE=4 SV=1 |XIRSILQRS/.../DIMNSSL
    >tr|I3L4K8|I3L4K8_HUMAN Carboxylesterase 5A OS=Homo sapiens GN=CES5A PE=4 SV=1 MSGNWVHPGQ/.../SLTFLSLLQPFFFFCAP
    Les "|" représentent les tabulations (ou un changement de cellule dans Excel)
    J'avais pensé à une stratégie en boucle, vu le grand nombre de protéines, où on recherche en premier lieu les ">", puis on concatenate jusqu'au prochain ">", sans l'inclure, on déplace la cellule avec la séquence au bout après le nom de la protéine (en Dx), puis on supprime la ligne vide qui vient de se créer, avant de recommencer. Impossible pour moi de faire cela, trop compliqué

    En fait, je parle de VBA et Excel, mais il est peut-être également possible (c'est même sur) de traiter directement le fichier .txt.... Mais je pense cela plus simple avec VBA.

    Est ce que quelqu'un pourrait m'aider?

    Je vous en remercie d'avance

    -----

  2. #2
    invite1d577638

    Re : Aide pour Macro VBA sous Excel 2007

    Salut,

    J'ai relu 3 fois ton message, il n'y a sûrement rien de compliqué dans ce que tu demandes, mais je suis navré, je ne comprends pas ce que tu veux faire !

    Tu veux séparer ton fichier texte dans différentes cellules ? Le module d'importation de données brutes d'excel permet de séparer les données si présence d'un séparateur tel que "|"... ????

    Tente si tu peux de coller une vue de excel avant/après !

  3. #3
    invite068a575a

    Re : Aide pour Macro VBA sous Excel 2007

    Tu te donnes effectivement beaucoup de mal... Il faut importer ton fichier dans un des innombrables éditeurs/analyseurs de séquences. Un de ceux que j'utilisais (et que j'ai toujours sur mon PC) est Bioedit (ici: http://www.mbio.ncsu.edu/bioedit/bioedit.html).

    Il importera tes séquences lignes par ligne et permet de faire un peu tout, dont une analyse de la composition en aa si c'est une protéine.

    Par ex. pour ta première séquence:

    Code:
    Protein: tr|I3L4K7|I3L4K7_HUMAN Nuclear pore complex protein Nup88 (Fragment) OS=Homo sapiens GN=NUP88 PE=4 SV=1
    Length = 110 amino acids
    Molecular Weight = 12978.13 Daltons
    
    Amino Acid  Number   Mol%
      Ala  A      9      8.18
      Cys  C      3      2.73
      Asp  D      6      5.45
      Glu  E      15     13.64
      Phe  F      2      1.82
      Gly  G      0      0.00
      His  H      0      0.00
      Ile  I      6      5.45
      Lys  K      12     10.91
      Leu  L      14     12.73
      Met  M      2      1.82
      Asn  N      2      1.82
      Pro  P      4      3.64
      Gln  Q      9      8.18
      Arg  R      10     9.09
      Ser  S      8      7.27
      Thr  T      1      0.91
      Val  V      3      2.73
      Trp  W      0      0.00
      Tyr  Y      3      2.73
    Il y en a bien d'autres. Evidement si c'est pour le fun de faire une macro en VBA il faut persévérer, d'autres te donneront les bonnes pistes.

    Francis

  4. #4
    invitee4e79868

    Re : Aide pour Macro VBA sous Excel 2007

    Avant tout : merci de vos réponses!

    C'est toujours le problème avec moi, j'ai du mal à me faire comprendre, surtout par écrit. Ma précédente chef disait que j’écrivais de la même façon que je pensais, de manière complètement unique. Je ne sais toujours pas s'il faut le prendre comme un compliment ou pas...

    @Franz Dur : j'avais déjà survolé les différents logiciels d'analyse (sur ce site). Malheureusement, c'est généralement des logiciels d'analyse ou d'alignement de séquences, voir de reconstruction 3D... Mon objectif est de réaliser une analyse extrêmement basique (exactement comme tu l'a montré, avec quelques calculs en plus) mais sur plus de 70000 protéines. Et qui puissent me permettre de ré-utiliser les données générées de façon simple.

    @Yoruk : Nom : presentation data proteome.gif
Affichages : 54
Taille : 154,2 Ko
    J'ai en plus incorporé le fichier Database (type txt un peu spécial, nommé FASTA). C'est un exemple pour les trois premières protéines. Il y a peut-être une astuce très simple (j'en suis sur) mais... Je rappelle qu'il y a 800000 lignes (un peu près) dans le ficher d'origine.

  5. A voir en vidéo sur Futura
  6. #5
    invite068a575a

    Re : Aide pour Macro VBA sous Excel 2007

    Bonjour,

    Je ne suis pas sur de comprendre.. Avant d'analyser (je pense que tu as les outils pour) tu veux simplement sortir tes séquences comme:
    >nom etc...
    mdvsntmllvavvaaywlwfqrisrwlkgr vwpvlgslpglieqrdrmhdwitenlrace tcetcetc...
    >nom etc..
    mdvsntmllv....
    Quand je voulais mettre des fichiers de séquences dans un format perso j'écrivais un petit programme en basic (avec un basic "basique" et gratuit genre Firstbasic). C'est vite fait et facile à tester et modifier. Si tu me mets un MP je peux t'envoyer un exemple que tu pourras tester et modifier pour tes besoins; Mais je ne vais pas les ré-écrire en VBA..

    Mais as-tu essayé Bioedit? Il fait probablement ce que tu veux, et au moins peut te sortir tes séquences dans d'autres formats.

    Francis

  7. #6
    invitee4e79868

    Re : Aide pour Macro VBA sous Excel 2007

    Bonjour (ou rebonjour),

    BioEdit ne peut pas fonctionner sur mon ordinateur (trop récent, Widows 8 64bits), mais j'ai trouvé un autre programme (sur l'ordinateur du chef - CLC), qui m'a permis de transformer automatiquement cette séquence FASTA en une autre séquence (gen), pour la génétique. Et j'ai ensuite pu injecté le tout dans Excel avec importer.

    Merci à tous les deux pour le temps que vous m'avez accorder!

Discussions similaires

  1. Macro VBA Excel 2003 : Envoi de mail
    Par inviteb6617790 dans le forum Programmation et langages, Algorithmique
    Réponses: 0
    Dernier message: 18/04/2012, 09h53
  2. Boutons Macro et VBA grisé Excel 2007
    Par invite66300359 dans le forum Logiciel - Software - Open Source
    Réponses: 1
    Dernier message: 09/08/2010, 17h39
  3. moyenne sous excel via VBA/macro/bouton
    Par invitede4f29f2 dans le forum Logiciel - Software - Open Source
    Réponses: 5
    Dernier message: 27/10/2009, 19h48
  4. Macro vba et solveur excel : problème
    Par invitec19ae6ef dans le forum Logiciel - Software - Open Source
    Réponses: 1
    Dernier message: 26/03/2009, 17h25
  5. VBA Excel: appliquer une macro a plusieurs fichiers
    Par inviteb73ce398 dans le forum Logiciel - Software - Open Source
    Réponses: 2
    Dernier message: 14/03/2007, 10h45