Répondre à la discussion
Affichage des résultats 1 à 17 sur 17

sujet pour programmation bio informatique



  1. #1
    mp3dux

    sujet pour programmation bio informatique


    ------

    Bonjour,

    Besoin d'aides de connaisseurs :

    je cherche une idée pour developer un programme informatique:

    En fait je dois faire un exposé dans le cadre d'une formation en Anglais. Il me faut juste un sujet de support pas ennuyeux, rien extravagant surtout que la bio-informatique n'est pas mon domaine (seulement un bac S SVT dans mon parcours).

    Je suis beaucoup plus habitué à travailler avec les systèmes embarqués j'ai juste envie de changer un peu de domaine et découvrir autre chose.

    Par exemple un sujet TP de programmation d'une durée de 2 semaines dans une école d'inge de derriere année ou Master 2 irait bien.

    mots clés : C/C++, Python, séquençage, genome, etc.

    Ou si vous avez d'autres idées à me proposer sur lesquelles je peux me baser pour developer une solution informatique...

    Merci d'avance

    -----
    Si nous faisions tout ce que nous sommes capables de faire, nous en serions abasourdis. T.E

  2. Publicité
  3. #2
    neoange

    Re : sujet pour programmation bio informatique

    Bonjour,

    je pense que l'outil bioinformatique The Genome Analysis Toolkit ou GATK serait une bonne base pour tes recherches. Il est très utilisé pour l'analyse bioinformatique des données en France

  4. #3
    Loupsio

    Re : sujet pour programmation bio informatique

    Bonsoir
    si neoange à répondu à ta question, tant mieux , parce que le titre était accrocheur, jme suis dis que j'allais contribuer,... et en fait j'ai rien pigé à ton problème :O

    T'es qui, quoi, tu sors d'ou? (t'es en biologie, en informatique, en fac de langue (anglais??) ou en école d'ingé?)

    On te demande de faire quoi? (un programme informatique de ton choix lié à la bio? préparer un TP pour des étudiants en bio-info ou d'école d'ingé? où répondre à un problème réel en bioinfo par quelque chose qui n'existe pas déja??)

    C'est un peu confus ton affaire (ou c'est moi qui pige rien.... c'est possible aussi )
    Dernière modification par Loupsio ; 10/02/2016 à 18h54.

  5. #4
    mp3dux

    Re : sujet pour programmation bio informatique

    Merci @neoange je suis en train de regarder GATK si ça convenir.

    je fais du development, on ne me demande rien de technique, je dois exposer un sujet quelconque de mon choix en anglais dans le cadre d'une formation.

    Ça m'intéresserait de travailler sur un truc du vivant pour changer des machines c'est tout, vu que je m’intéresse à la culture scientifique.

    Si je peux trouver un sujet qui nécessite peu de connaissance en biologie et des competences en programmation ça serait l'idéal.

    Par exemple un programme qu'un biologiste peut demander à un développeur de réaliser parce qu'il n'a pas les compétences.

    Je vois qu'il ya pas mal de logiciel tout fait, mais l'idéal pour moi c'est d’écrire moi même un programme, un algo, ou d'améliorer un truc qui se fait déjà en le faisant tourner plus vite genre une simulation.

    Mais c'est pour ça que je viens vers vous les spécialistes, en gros je vous propose de me donner un problème à resoudre ou une solution à optimiser .
    Si nous faisions tout ce que nous sommes capables de faire, nous en serions abasourdis. T.E

  6. #5
    minushabens

    Re : sujet pour programmation bio informatique

    tiens un problème dont m'a parlé un collègue ce matin: il a des données sur l'expression de tous les gènes d'un certain organisme (le transcriptome comme on dit). Donc il a une liste de noms de gènes et en face de cette liste des quantités de transcrits, cela pour un certain nombre d'individus. Certains gènes sont exprimés de façon très uniforme entre les individus (les gènes de ménage par exemple). D'autres ont des expressions très différentes, et cela il voudrait essayer de le corréler avec certaines données dépendant de l'individu (le lieu de prélèvement par exemple). Mais pour que sa recherche ait un sens il a besoin de savoir, pour les gènes d'expression variable, quelle fonction a la protéine correspondante (dans la mesure où on le sait).

    Là où la bioinformatique intervient, c'est qu'il a 12000 gènes, et qu'il ne peut pas chercher à la main dans une banque de données quelles sont les protéines dont l'activité est connue, et quelle activité, etc. Il faut automatiser cette recherche. Je lui suggéré l'idée suivante (je ne sais pas si ça n'existe pas déjà): pour chaque nom de gène, chercher dans une base de données bibliographique (pubmed) le nombre d'occurences du nom, et renvoyer les x% gènes les plus cités, éventuellement en filtrant à l'aide d'autres mots-clés, comme virulence, pathogénicité, etc (il s'agit de parasites).

    Je pense que ce n'est pas très dur à formaliser, et d'ailleurs dans bioconductor il y a des outils pour interroger des bases en ligne.

  7. A voir en vidéo sur Futura
  8. #6
    Loupsio

    Re : sujet pour programmation bio informatique

    Ok, donc ce n'est pas : "un exposé dans le cadre d'une formation en Anglais", c'est "un exposé en anglais dans le cadre d'une formation" ^^je ne comprenais pas comment tu envisageait de faire de la bioinfo dans un cursus de langues, sans avoir fait de biologie ni de programmation

    Et donc si tu es libre dans le choix du projet (totalement libre) alors effectivement les possibilitées sont multiples, tu as des centaines, que dis-je... des milliers de possibilités


    1) Un classique : l'alignement de séquences (alignement local par exemple)
    il s'agit de faire lire deux fichiers fasta (un fichier texte, très simple, tu pourra regarder sur google si ca ne te parles pas) ces deux fichiers fasta contiennent chacun une séquence génétique, et le but du programme est d'analyser la relation entre ces deux séquences et déterminer la proximité entre ces deux séquences (insertion de portions de gène, délétions, mutations, et ressortir un score, le meilleur chemin ainsi que le tracé arrière reliant les deux séquences)
    Un alignement local type algorithme smith et waterman devrait être facilement réalisable même sans trop de connaissances en bio
    Si ca t'interesse mais que la partie "biologie" te semble obscure je dois pouvoir retrouver le rapport que j'avais fait en L3 (moins les fragments de code bien sur) afin que tu comprenne la facon de procédé

    2) Analyses de données immédiates via R
    Je me suis par exemple récemment fais un ptit script qui récupère un fichier .csv fabriqué par l'ordinateur à la fin d'une manip par un appareil de mesure, et simplement lancer le script R va analyser lui même le fichier généré, et agir en conséquence pour tracer les bons graphiques, faire les bon test statistiques par lui même (donc avec arbre de décision qui va orienter ce qu'il doit faire des données), detecte le nombre de conditions testées (souvent 2, car "control" et "condition testée", mais parfois plus que deux) et va faire les graphs (et les adapter) en conséquence et ressortir le tout en pdf sans avoir rien de plus a faire qu'un Ctrl+C Ctrl+V

    3) Détermination d'amorces PCR
    Le but est de donner au programme un fichier fasta (encore) et le logiciel determine les meilleurs amorces possibles pour une ampification PCR (en fonction de taille optimale, GC pourcent, calcul de la température qu'il sera nécessaire d'utiliser pour l'hybridation, le pourcentge d'homologie entre les séquences si il s'agit d'amorces dégénérées et donc réalisées a partir de plusieurs séquences, la position de l'amorce dans le gène) et enregistrer les différentes possibilitées d'amorces et leurs caracteristiques dans un fichier

    4) Une personne en psychologie (pas vraiment de la biologie, mais un cousin éloigné de la biologie ^^) m'avait demandée de lui réaliser un programme qui ouvre une petite fenêtre et lorsque l'utilisateur commence a appuyer sur une touche au clavier, un compte a rebours démarre et compte le nombre de fois que la touche aura été pressée dans un laps de temps, et l'utilisateur devait aller le plus vite possible

    si ca peut te donner des idées... , mais il y a encore pleins d'exemple que l'on pourrait citer

  9. Publicité
  10. #7
    mp3dux

    Re : sujet pour programmation bio informatique

    Bonjour à tous,

    Citation Envoyé par Loupsio Voir le message
    Ok, donc ce n'est pas : "un exposé dans le cadre d'une formation en Anglais", c'est "un exposé en anglais dans le cadre d'une formation" ^^je ne comprenais pas comment tu envisageait de faire de la bioinfo dans un cursus de langues, sans avoir fait de biologie ni de programmation

    Tout à fait "un exposé -dans le cadre d'une formation- en anglais"

    Merci à vous 3 trois pour les réponses . Pas besoin de chercher plus loin, un des trois sujets suivant devrait faire l'affaire :

    -le sujet de @12h29minushabens avec les 12000 gènes

    -les sujets de @Loupsio
    1- l'alignement de séquences
    3- Détermination d'amorces PCR

    Il faudra que je fasse un choix entre ces trois, mais pour cela je dois avoir une idée "approximative" du travail que j'ai à réaliser dans chaque cas, des prérequis si possible...

    On peut citer avantages et inconvénients de chaque sujet ?
    Si nous faisions tout ce que nous sommes capables de faire, nous en serions abasourdis. T.E

  11. #8
    Loupsio

    Re : sujet pour programmation bio informatique

    dans les inconvénients du sujet de minuhabens, je dirai qu'il va falloir passer par une API (genre l'API de "ensembl"), je sais que bien souvent ce type de programme les bioinfo pure les font avec Perl, je sais pas si c'est question de préférence, ou juste impossible avec d'autres langages, car j'ai jamais fait, mais vu comment c'est dégueu Perl, je pense pas que ce soit par plaisir xD
    en avantage je dirai que c'est très satisfaisant de passer du temps à créer un programme qui te fais le café par la suite et t'évite de longues nuit blanche afaire tout manuellement pour les miliers de gènes xD mais ca je suis pas sur que ce soi ton souci, au niveau programmation, avantages je sais pas trop,
    Ah si!! Tu n'as pas besoin de connaissances en biologie pour faire ca, concrètement c'est de la récupération de donnée, que ce soit récupérer la fonction d'un gène, ou le prix du cacao en antartique... niveau progra c'est du pareil au même, tu t'économise l'aspect "comprendre ce que j'ai a faire avant tout"

    L'alignement de séquence, d'un point de vue programmation je le trouve sympa parce que pas hyper compliqué en soi, mais juste assez prise de tête pour être motivant, le truc final est pas simple a visualiser au tout début du programme ducoup tu le refond deux trois fois avant d'avoir quelque chose de potable et à la fin c'est class' e plus tu peuxfacilement trouver d'autres trucs simples à ajouter dedans pour impressionner un peu ^^ genre "bon a la base il fait ca mais j'ai voulu aller plus loin, et il offre aussi la possibilité de donner à l'utilisateur ca, et ca et ca..." tout en restant dans l'addition de petits "pluss" très simple en terme de codage.
    En revanche il te faudra quelques notions de biologie , mais bon pas des trucs énormes non plus

    La détermination d'amorce est largement plus simple, mais peut prendre un peu de temps quand même, après c'est pareil tout dépend de ce qu'on met dedans, il y a les grands critères de determinations et il y a les trucs un peu plus poussés
    pas vraiment de connaissances en bio requises, si ce n'est savoir remplacer un T par un A et un C par un G (et vice versa) pour lui renvoyer le complémentaire de la séquence analysée, le reste c'est principalement des règles a suivre par rapport à "qu'est ce qu'une bonne amorce PCR" mais j'ai envie de dire... dans to cas t'as meme pas besoin de comprendre le pourquoi du comment, si ca doit faire 20 nucleotides + ou - 4 ou 5 ou qu'il y ait tel nucléotide au bout de la séquence et pas un autre... bah tu fais en sorte que ca le fasse même si tu sais pas pourquoi, c'est pas grave
    au final, plus simple que l'alignement mais légèrement moins fun à réaliser

    Les deux derniers se font très bien en Python

  12. #9
    mp3dux

    Re : sujet pour programmation bio informatique

    Merci pour toutes ces infos, compte tenu de ces elements le sujet proposé par @minushabens me semble plus adapté. Mais je vais garder sous le coude l'alignement de séquences et la détermination d'amorces pour m'initier au domaine dès que j'aurai l'occasion. A ce sujet je cherche depuis pas mal de temps un livre un peu généraliste pour m'initier un peu, j'en ai pris un qui est intéressant mais d'un autre point de vue
    Quand la vie remplace le silicium - Aux frontières de la bio-informatique

    Sur celle là "Bioinformatique
    Cours et applications"
    , la table des matières à l'air intéressante, je retrouve mêmes les termes que tu as cités plus haut, ça a l'air pas mal non ?
    http://medias.dunod.com/document/978...euilletage.pdf


    PS : minushabens, j'aurai besoin de prendre contact avec toi par message privé ou mail si tu veux bien.
    Dernière modification par mp3dux ; 24/02/2016 à 12h03.
    Si nous faisions tout ce que nous sommes capables de faire, nous en serions abasourdis. T.E

  13. #10
    minushabens

    Re : sujet pour programmation bio informatique

    Citation Envoyé par mp3dux Voir le message
    PS : minushabens, j'aurai besoin de prendre contact avec toi par message privé ou mail si tu veux bien.
    si tu veux mais je n'ai pas plus d'infos sur ce que j'ai évoqué. C'était juste une idée.

    pour ce qui est de l'alignement de séquences, aujourd'hui on travaille sur des gros ensembles de données, et on a besoin d'algorithmes capables d'aligner un million de séquences en une fois (il en existe d'ailleurs).

  14. #11
    mp3dux

    Re : sujet pour programmation bio informatique

    Citation Envoyé par minushabens Voir le message
    si tu veux mais je n'ai pas plus d'infos sur ce que j'ai évoqué. C'était juste une idée.
    Ok, je vais chercher de mon côté sur le net si je trouve un sujet bien formulé sur l'alignement des sequences, je ne veux pas perdre non plus trop de temps à chercher...
    Si quelqu'un d'autre trouve un proche bien formulé je suis preneur...
    Sinon je prends un et je travaille à son optimisation...

    Que penses- tu à premier abord du livre Dunod ?
    Si nous faisions tout ce que nous sommes capables de faire, nous en serions abasourdis. T.E

  15. #12
    minushabens

    Re : sujet pour programmation bio informatique

    aucune idée sur ce livre, je ne suis pas bio-informaticien, plutôt maths/stats.

  16. Publicité
  17. #13
    Loupsio

    Re : sujet pour programmation bio informatique

    Comme tu veux pour le programme, c'est à toi de le faire donc à toi de choisir celu qui te conviens le mieux, mais après pour les programmes python si besoin jpeux t'aider, t'orienter ou t'expliquer, par contre pour le premier, je suis dans le meme cas que minushabens

  18. #14
    mp3dux

    Re : sujet pour programmation bio informatique

    Citation Envoyé par minushabens Voir le message
    aucune idée sur ce livre, je ne suis pas bio-informaticien, plutôt maths/stats.
    ok.

    Citation Envoyé par Loupsio Voir le message
    Comme tu veux pour le programme, c'est à toi de le faire donc à toi de choisir celu qui te conviens le mieux, mais après pour les programmes python si besoin jpeux t'aider, t'orienter ou t'expliquer, par contre pour le premier, je suis dans le meme cas que minushabens
    Oui je vais chercher des sujets cette semaine. En attendant tu penses quoi du livre ?
    Si nous faisions tout ce que nous sommes capables de faire, nous en serions abasourdis. T.E

  19. #15
    Loupsio

    Re : sujet pour programmation bio informatique

    En attendant tu penses quoi du livre ?
    le pdf n'est pas le livre entier, donc ca ne te suffira pas, mais si tu comptes acheter le livre, alors oui il a l'air pas mal,
    De ce que j'ai pu lire des quelques pages qui sont dans le pdf, il a l'air pas mal, traitant a la fois des trucs basiques et d'autres hautement plus complexes, et les explication on l'air d'etre simples a comrpendre même pour quelqu'un qui n'aurai pas de larges connaissances en bio,

    pour les programmes python si besoin jpeux t'aider, t'orienter ou t'expliquer, par contre pour le premier, je suis dans le meme cas que minushabens
    Oui je vais chercher des sujets cette semaine.
    Quand je parlais des programmes en python, je parlais des deux mentionnés plus haut (qui peuvent facilement se faire en python), si tu parlais d'autres sujet en utilisant le langages python,... peut etre que je pourrais aussi t'aider, mais pas sur, selon le niveau qu'il faut en programmation pour le faire,
    Dernière modification par Loupsio ; 25/02/2016 à 19h48.

  20. #16
    mp3dux

    Re : sujet pour programmation bio informatique

    Le premier lien du livre ne passe pas, celui là devrait aller mieux. En plus il est recent, il m'a l'air bien fait. je viens de le commander, merci pour l'avis .
    Si nous faisions tout ce que nous sommes capables de faire, nous en serions abasourdis. T.E

  21. #17
    Loupsio

    Re : sujet pour programmation bio informatique

    il s'agit du meme lien que tu as mis précédemment (pas la meme page internet, mais même livre, c'est bien de celui la que je parlais quand je disais qu'il avait en effet l'air pas mal a priori
    (il y avait deux liens, le premier qui n'ouvre rien, et le deuxieme qui ouvre directement l'extrait du livre que tu viens de redonner )

Discussions similaires

  1. Etudes de programmation informatique
    Par NanoPish dans le forum Orientation après le BAC
    Réponses: 10
    Dernier message: 18/11/2015, 21h13
  2. informatique, programmation...quelles études?
    Par cloud89 dans le forum Orientation après le BAC
    Réponses: 14
    Dernier message: 23/07/2012, 23h31
  3. TIPE Maglev programmation informatique
    Par sender003 dans le forum Physique
    Réponses: 3
    Dernier message: 16/05/2012, 15h02
  4. informatique programmation
    Par bottle147 dans le forum Programmation et langages, Algorithmique
    Réponses: 16
    Dernier message: 01/01/2012, 12h19
  5. aide au choix de sujet de these en informatique
    Par sonia9999 dans le forum TPE / TIPE et autres travaux
    Réponses: 0
    Dernier message: 01/10/2007, 10h06