Qualitativement, nous croyons que ces applications sont à peu près similaires et qu'elles calculent à peu près la même chose. Nous sommes actuellement en discussion avec l'équipe de SIMAP pour voir comment nous pourrions utiliser leurs résultats pour éviter de calculer les séquences Pfam (Pfam est une grande collection de séquences d'alignement et de modèle de Markov caché couvrant de nombreuses familles de protéines communes) correspondant aux séquences connues de protéines bactériennes issues des bases de données publiques. Nous nous intéressons aussi à leur application, pour voir ce que nous pouvons tirer de leur expérience, et peut-être tirer avantage de leurs efforts à avoir développer une application BOINC native pour ces calcul (voir plus bas).
Les différences entre eux et nous telles que je les vois et d'après nos connaissances actuelles :
* SIMAP hmmer est une véritable application BOINC, avec des points de reprise des calculs, un pourcentage de progression des calculs et un certain nombre de modifications du code pour améliorer les performances d'entrée/sortie.
* Lattice HMMPfam est une application encapsulée pour la faire fonctionner avec BOINC, avec pratiquement aucun changement au code hmmpfam.
* SIMAP hmmer est utilisé pour calculer des séquences Pfam pour toutes les séquences de protéines disponibles disponibles dans les bases de données de séquences de protéines.
* Lattice HMMPfam est utilisé pour calculer les séquences Pfam pour toutes les séquences protéiniques des bactéries issues des bases de données publiques de séquences de protéines, ainsi qu'un lot de prédictions issues de Glimmer3 de génome bactérien. [ C'est la source actuelle du lot de WU à traiter]. Si vous le désirez, je serai enchanté de vous expliquer pourquoi l'ajout des prédictions de Glimmer3 est utile.
* Les 2 projets utilisent des paramètres légèrement différents vis à vis de l'application hmmpfam sous-jacente. Nous ne savons pas si ces légères différences seront significatives ou non.
* Le projet SIMAP semble très orienté vers ses 2 applications. Le but de Lattice (d'après ce que j'en sais, voir Mike et Adam pour la ligne de conduite officielle :-) semble plus être d'assister de nombreuses différentes applications se centrant sur la bioinformatique. HMMPfam est la première application de données lourdes pour Lattice, et en tant que tel, ne calcule pas seulement des choses utiles pour moi :-), mais aussi pour aider le projet Lattice à améliorer son infrastructure générale à supporter ces types d'applications bioinformatiques.
En espérant avoir aidé,
nathan
---------------------------
Bref, en gros, pour le projet HMMPfam, ils font pareil que SIMAP (à 3 poils de cul près) à part l'ajout de quelques données issues d'un modèle de prédiction de séquences à partir du génome bactérien. Cette application semble donc plus être de quoi tester l'infrastructure de Lattice.
Enfin, la seule démarcation réelle entre SIMAP et Lattice est que Lattice a pour but d'aider d'autres chercheurs en intégrant leurs application à BOINC. Lattice est donc une forme de WCG proposant en plus la gestion du portage de l'application sur BOINC.