Je me trompe peut-être hein, mais c'est ce que j'ai cru comprendre
Ah, voilà, j'ai retrouvé le texte :
Pour comprendre la fonction d'une protéine et, le cas échéant, pour la modifier ou la contrôler, la connaissance de la structure moléculaire tri-dimensionnelle est essentielle. Or, les projets internationaux de séquençage de génomes ont fait véritablement exploser la quantité d'information génomique disponible. Mais le nombre de structures de protéines connues augmente beaucoup moins vite. L'écart entre le nombre de séquences et le nombre de structures connues continue donc de se creuser. La simulation moléculaire peut aider à résoudre ce problème, en fournissant des prédictions de la structure 3D à partir de la séquence d'acides aminés d'une protéine. C'est le problème classique du repliement. Mais cette classe de prédictions est très difficile, et il est intéressant de renverser le problème, pour s'intéresser au problème inverse du repliement. Il ne s'agit plus de prédire la structure à partir de la séquence, mais d'identifier les séquences les plus favorables correspondant à un repliement (une structure tri-dimensionnelle) donné. Nous nous proposons de résoudre ce problème inverse pour tous les repliements protéiques connus. Ces quelques 2000 repliements représentent une fraction importante des repliements qui existent dans la nature ; probablement de l'ordre de 50%. Identifier les séquences associées, c'est réaliser une “carte des séquences”, qui balise une fraction importante de l'espace des séquences protéiques, et relie chacune à une structure 3D. Cette carte réduirait le problème de prédiction de structure au problème, plus simple, de comparaison de séquences. En effet, pour chaque nouveau gène, il suffirait de comparer sa séquence d'acides aminés avec celles de la carte: les séquences les plus proches dans la carte nous indiqueraient le repliement préférentiel de la nouvelle séquence. La cartographie à grande échelle que nous proposons permettrait donc d'avancer dans l'attribution des structures
(eg dans le contexte de la génomique structurale), l'attribution des fonctions (pour l'annotation des génomes et la protéomique), et l'ingénierie de protéines avec des fonctions nouvelles.
C'est un peu long, c'est un copier coller de .pdf donc ce n'est peut-être pas terrible.