Le Forum de l'Alliance Francophone


  • Projet du Mois FB: Asteroids@home

Auteur Sujet: Mapping Cancer Markers Begins Analyzing Lung and Ovarian Cancer Data  (Lu 4697 fois)

0 Membres et 1 Invité sur ce sujet

Hors ligne [AF] fansyl

  • Boinc'eur devant l'éternel
  • *****
  • Messages: 2403
Si quelqu'un a les capacités et le courage de s'y mettre:


By: The Mapping Cancer Markers research team
17 oct. 2016     

The Mapping Cancer Markers researchers are analyzing the results of the lung cancer research tasks run on World Community Grid, as well as the first sets of ovarian cancer data. This update gives a detailed look at the tools and processes they are using for this analysis, plus a list of their recent publications and events in their lab.

The Mapping Cancer Markers project aims to identify chemical markers associated with various types of cancer. This will help researchers detect cancer earlier and design more personalized cancer care. Below, the research team describes how they are analyzing the lung cancer data from research tasks that were run on World Community Grid, as well as the first sets of ovarian cancer data. They also update us on happenings in their lab, and provide information on their recent publications.
Lab news

Dr. Anne-Christin Hauschild has recently joined our lab as a postdoctoral research fellow, and will be contributing to the Mapping Cancer Markers project by applying data mining and machine learning algorithms to further prioritize signatures and characterize involved genes.

Our work was recognized for the third time in the row by Thomson Reuters, who included us in the highly cited researcher list, out of 127 in computer science and 3,266 world-wide in 21 fields of science.
Transition to the ovarian dataset

Our previous update described the planned transition to an ovarian cancer dataset from the lung cancer analysis. Due to the timing of the ovarian dataset tests and their launch on World Community Grid, we had several extra, unscheduled days of lung cancer analysis. We used these extra days to explore larger lung cancer signatures (30-100 markers). Previous Mapping Cancer Markers lung cancer work units explored smaller signatures (5-25 markers). All lung cancer results have since been collected, along with the first few months of ovarian cancer results. We are hard at work analyzing the completed lung and preliminary ovarian results.
How we are processing results

As part of this work, we have overhauled how we handle and process the results we receive from World Community Grid. Specifically, we have changed our Extract-Transform-Load (ETL) system which takes the raw, packaged research tasks received from World Community Grid, and unpacks, collates, reorganizes, and recodes results into an efficient and easy-to-load format for subsequent analyses. Our previous ETL system was built into our IBM InfoSphere Streams analysis pipeline. Separating the ETL stage from the analysis benefits the project in several ways. It allows us to more efficiently store data, it simplifies our main Streams-based analysis pipeline, and most importantly, it allows direct analysis of MCM results with other tools and platforms (such as data mining and data analysis tools like R and scikit-learn).
Minimizing potential bias in the ovarian cancer dataset

The Mapping Cancer Markers ovarian cancer dataset combines data from multiple, independent cancer studies. These studies did not follow identical protocols in selecting patients, tissue sample collection or preparation, or recording of clinical covariates. Combining data from multiple sources together requires careful normalization (the process of reorganizing data). The search for successful signatures in such a dataset is made easier if the dataset minimizes bias. We will continue to study the issue of data normalization in the ovarian cancer dataset, and may update the dataset in the future if we discover improvements, or if analysis of results reveals biases.
Data integration portals

Our team has developed two data integration portals to help us interpret and validate the results we receive from Mapping Cancer Markers. The functions of these two portals, called mirDIP and pathDIP, are described in detail below.
Using mirDIP to interpret Mapping Cancer Markers results

One of the projects that our group has been working on in the past several months is the MicroRNA Data Integration Portal (mirDIP). This web resource allows users to query MicroRNAs (miRNAs) and to investigate their interactions with messenger RNA (mRNA) targets. MicroRNAs are short and non-coding RNA molecules observed across plants, animals and viruses(1). For the most part, these short molecules bind to mRNA to control the quantity of protein production. For example, in the case where someone might be injured and is bleeding, if the body determines that there is an immediate need for more blood, miRNAs may bind to their targets and turn up the production of the protein hemoglobin. These molecules are important in the study of cancer because, in part, they control when things should be turned on or off. MiRNAs are known to target more than one gene, so understanding their relationships with genes is an important step in understanding how genes and proteins function.

One of the ways that we plan to use mirDIP in tandem with our Mapping Cancer Markers project is to look more closely at common genes identified by the two methods. Below, we use an example of how this is done. If we take one of many publications to start(2), we can identify miRNAs that are known to be related to ovarian cancer. As seen in a figure from the publication, we can identify some of the key players involved. Networks such as this provide valuable information, yet by no means completely characterize the environment. 
(Click image to see an enlarged version)

Figure 1. Oncogenic and tumor suppressor miRNAs in ovarian carcinoma. Based on their function, miRNAs can be used for diagnostics and therapeutics. Certain miRNAs such as miR-200 family, let-7 family, miR-21, miR-214, and miR-100 have strong diagnostic/prognostic potential in ovarian cancer. Figure and caption from paper by Zaman et al. (2), licensed under CC BY 2.0.

We can use mirDIP to identify other major and minor genes that may be involved in these processes. If we submit a query using the 8 example miRNAs, and limit results to those referenced in at least 5 databases, we can quickly narrow down a list of genes of interest. Here, we show an analysis using the software package we developed for visualizing and analyzing protein-protein interaction networks (NAViGaTOR 3.0) of 8 miRNAs and associated genes, where at least 2 miRNAs are targeting a gene. 
(Click image to see an enlarged version)

Figure 2.  NAViGaTOR 3.0 network of ovarian cancer-associated miRNAs and genes.  Turquois nodes indicate miRNAs and grey boxes indicate associated genes, predicted by our mirDIP portal.  Two of the miRNAs hsa-mir-34a-5p and has-mir-34c-5p are related to each other and thus have a high amount of overlap across genes they regulate.  Hsa-mir-100-5p has no interacting genes; however, this network only shows interactions validated by over 5 independent databases.  Hsa-mir-100-5p interactions may only have been significantly identified using fewer sources.

In turn, those genes may indicate critical pathways (some of which are identified in Figure 1) or novel pathways, which may be compromised. If we compare the results of our mirDIP analysis to our highest-scoring Mapping Cancer Markers signatures, we can further identify particular genes of interest.  Understanding which players (pathways, genes, proteins, miRNAs, etc) are involved and predicting the possible mechanism will lead to focusing further studies, and may lead to identifying targeted treatment for specific patient subgroups—the goal of precision medicine.
Systematic and comprehensive pathway analysis using pathDIP

This brings us to another resource we have created for comprehensive characterization of cancer profiles: pathDIP. Importantly, this public resource integrates 20 databases and enables computational prediction of pathway association, necessary step to fully understand signal cascades in healthy and disease conditions. Cross-validation determined 71% accuracy of our predictions, and predictions provide novel annotations for 5,732 proteins previously lacking pathway characterization.

Taking the results from Figure 2 (the 36 genes identified by mirDIP), the pathDIP portal identifies two significantly enriched pathways (p < 0.05): 1) MicroRNAs in cancer, and 2) Central carbon metabolism in cancer (KEGG database). The first pathway directly confirms our steps to this point while the latter pathway indicates another avenue for exploration. Indeed, the central carbon metabolism pathway includes the conversion of glucose to lactic acid, a process known as the Warburg effect, which is common in ovarian and other cancers. This process has been shown to be controlled by nitric oxide (3) as well as other miRNAs (4).
Studying broccoli’s anti-cancer properties

However, going back to microRNA gene regulation – the mirDIP portal now enables us to study whether microRNAs from animals, plants and viruses could regulate human genes. This cross-species regulation mechanism opens enormous potential for understanding increase in disease risk and prevention. As a first study in this direction, we have recently completed and published a paper showing that broccoli microRNAs do regulate human genes, upregulated in lung cancer, thus providing a potential explanation of why broccoli consumption has been linked to anti-cancer properties by many epidemiological studies.


Je crunche dans le silence et c'est ma joie !
Ryzen 1700X/32Go/GTX970 (sous WC) - i7-3770T/16Go/HD4000 - Ryzen 5700G/32Go/GTX1050 - Q9550/8Go/GT1030 - 3xAndroidBox S912

Hors ligne [AF] fansyl

  • Boinc'eur devant l'éternel
  • *****
  • Messages: 2403
Proposition de traduction

Mapping Cancer Markers commence à analyser les données sur le cancer du poumon et de l'ovaire

Par l'équipe de recherche Mapping Cancer Markers
17 octobre 2016

Les chercheurs de Mapping Cancer Markers analysent les résultats des travaux de recherche sur le cancer du poumon exécutés sur World Community Grid, ainsi que les premières séries de données sur le cancer de l'ovaire. Cette mise à jour donne un aperçu détaillé des outils et des processus qu'ils utilisent pour cette analyse, ainsi qu'une liste de leurs publications et événements récents dans leur laboratoire.

Le projet Mapping Cancer Markers vise à identifier les marqueurs chimiques associés à divers types de cancer. Cela aidera les chercheurs à détecter le cancer plus tôt et à concevoir des soins plus personnalisés. Ci-dessous, l'équipe de recherche décrit comment elle analyse les données sur le cancer du poumon provenant de travaux de recherche effectués sur World Community Grid, ainsi que les premières séries de données sur le cancer de l'ovaire. Ils nous tiennent également au courant de ce qui se passe dans leur laboratoire et fournissent de l'information sur leurs publications récentes.

Nouvelles du laboratoire
La Dre Anne-Christin Hauschild s'est récemment jointe à notre laboratoire à titre de post-doc et contribuera au projet Mapping Cancer Markers en appliquant des algorithmes d'exploration de données et d'apprentissage machine afin de prioriser davantage les signatures et de caractériser les gènes impliqués.

Notre travail a été reconnu pour la troisième fois consécutive par Thomson Reuters, qui nous a inclus dans la liste des chercheurs les plus cités, sur 127 en informatique et 3 266 dans le monde entier dans 21 domaines scientifiques.

Transition vers l'ensemble de données ovariennes
Notre mise à jour précédente décrivait la transition prévue vers un ensemble de données sur le cancer de l'ovaire à partir de l'analyse du cancer du poumon. En raison du calendrier des tests des ensembles de données ovariennes et de leur lancement sur World Community Grid, nous avons eu plusieurs jours supplémentaires non programmés d'analyse du cancer du poumon. Nous avons utilisé ces jours supplémentaires pour explorer de plus grandes signatures de cancer du poumon (30-100 marqueurs). Les précédentes unités de travail sur les marqueurs du cancer du poumon ont exploré des signatures plus petites (5-25 marqueurs). Tous les résultats du cancer du poumon ont été recueillis depuis, de même que les résultats des premiers mois de cancer de l'ovaire. Nous travaillons d'arrache-pied pour analyser les résultats complets des poumons et les résultats préliminaires des ovaires.

Comment nous traitons les résultats
Dans le cadre de ce travail, nous avons revu la façon dont nous manipulons et traitons les résultats que nous recevons de World Community Grid. Plus précisément, nous avons modifié notre système Extract-Transform-Load (ETL) qui prend les tâches de recherche brutes et emballées reçues de World Community Grid et déballe, rassemble, réorganise et recode les résultats dans un format efficace et facile à charger pour les analyses ultérieures. Notre ancien système ETL a été intégré à notre pipeline d'analyse des flux InfoSphere Streams d'IBM. Séparer l'étape ETL de l'analyse présente plusieurs avantages pour le projet. Il nous permet de stocker plus efficacement les données, il simplifie notre pipeline principal d'analyse basée sur les flux, et surtout, il permet l'analyse directe des résultats MCM avec d'autres outils et plates-formes (tels que l'exploration de données et les outils d'analyse de données comme R et scikit-learn).

Minimiser un biais potentiel dans l'ensemble de données sur le cancer de l'ovaire.

L'ensemble de données sur le cancer de l'ovaire Mapping Cancer Markers combine des données provenant de multiples études indépendantes sur le cancer. Ces études n'ont pas suivi les mêmes protocoles pour la sélection des patients, le prélèvement ou la préparation d'échantillons de tissus ou l'enregistrement des covariables cliniques. La combinaison de données provenant de sources multiples exige une normalisation minutieuse (le processus de réorganisation des données). La recherche de signatures réussies dans un tel ensemble de données est facilitée si l'ensemble de données minimise les biais. Nous continuerons d'étudier la question de la normalisation des données dans l'ensemble de données sur le cancer de l'ovaire, et nous pourrions mettre à jour l'ensemble de données à l'avenir si nous découvrons des améliorations ou si l'analyse des résultats révèle des biais.

Portails d'intégration de données
Notre équipe a développé deux portails d'intégration de données pour nous aider à interpréter et valider les résultats que nous recevons de Mapping Cancer Markers. Les fonctions de ces deux portails, appelés mirDIP et pathDIP, sont décrites en détail ci-dessous.

Utilisation de mirDIP pour interpréter les résultats de la cartographie des marqueurs du cancer

L'un des projets sur lequel notre groupe a travaillé au cours des derniers mois est le Portail d'intégration de données MicroRNA (mirDIP). Cette ressource Web permet aux utilisateurs d'interroger les microARNs (miARNs) et d'étudier leurs interactions avec les cibles de l'ARN messager (ARNm). Les microARN sont des molécules d'ARN courtes et non codantes observées chez les plantes, les animaux et les virus(1). Dans la plupart des cas, ces courtes molécules se lient à l'ARNm pour contrôler la quantité de protéines produites. Par exemple, dans le cas où une personne pourrait être blessée et saigner, si le corps détermine qu'il y a un besoin immédiat de plus de sang, les miARNs peuvent se lier à leurs cibles et augmenter la production de la protéine hémoglobine. Ces molécules sont importantes dans l'étude du cancer parce que, en partie, elles contrôlent le moment où les choses doivent être allumées ou éteintes. Les MiRNAs sont connus pour cibler plus d'un gène, donc la compréhension de leurs relations avec les gènes est une étape importante dans la compréhension du fonctionnement des gènes et des protéines.

L'une des façons dont nous prévoyons d'utiliser mirDIP en tandem avec notre projet Mapping Cancer Markers est d'examiner de plus près les gènes communs identifiés par les deux méthodes. Ci-dessous, nous utilisons un exemple de la façon de procéder. Si nous prenons une des nombreuses publications pour commencer(2), nous pouvons identifier les miARNs qui sont connus pour être liés au cancer de l'ovaire. Comme le montre une figure de la publication, nous pouvons identifier certains des principaux acteurs impliqués. Des réseaux comme celui-ci fournissent des informations précieuses, mais ne caractérisent en aucun cas complètement l'environnement. 

Figure 1. Oncogène et suppresseur de tumeur miRNAs dans le carcinome ovarien. Selon leur fonction, les miARNs peuvent être utilisés pour le diagnostic et la thérapeutique. Certains miRNAs tels que la famille miR-200, la famille let-7, miR-21, miR-214, miR-214 et miR-100 ont un fort potentiel de diagnostique/pronostique dans le cancer de l'ovaire. Figure et légende tirées d'un article de Zaman et al (2), sous licence CC BY 2.0.

Nous pouvons utiliser mirDIP pour identifier d'autres gènes majeurs et mineurs qui peuvent être impliqués dans ces processus. Si nous soumettons une requête en utilisant les 8 exemples de miRNAs, et limitons les résultats à ceux référencés dans au moins 5 bases de données, nous pouvons rapidement réduire la liste des gènes intéressants. Nous présentons ici une analyse à l'aide du logiciel que nous avons développé pour visualiser et analyser les réseaux d'interaction protéine-protéine (NAViGaTOR 3.0) de 8 miARNs et des gènes associés, où au moins 2 miARNs ciblent un gène.

Figure 2.  NAViGaTOR 3.0 réseau de miARNs et de gènes associés au cancer de l'ovaire.  Les nœuds turquoises indiquent les miRNAs et les cases grises indiquent les gènes associés, prédits par notre portail mirDIP.  Deux des miARNs hsa-mir-34a-5p et has-mir-34c-5p sont apparentés l'un à l'autre et ont donc une grande quantité de chevauchement entre les gènes qu'ils régulent.  Hsa-mir-100-5p n'a pas de gènes en interaction ; cependant, ce réseau ne montre que des interactions validées par plus de 5 bases de données indépendantes.  Les interactions Hsa-mir-100-5p peuvent n'avoir été identifiées de manière significative qu'en utilisant moins de sources.

À leur tour, ces gènes peuvent indiquer des voies critiques (dont certaines sont identifiées à la figure 1) ou de nouvelles voies, qui peuvent être compromises. Si nous comparons les résultats de notre analyse mirDIP à nos signatures de marqueurs de cartographie du cancer, nous pouvons identifier des gènes particuliers d'intérêt.  Comprendre quels acteurs (voies d'entrée, gènes, protéines, miARNs, etc.) sont impliqués et prédire le mécanisme possible mènera à d'autres études et pourrait mener à l'identification d'un traitement ciblé pour des sous-groupes de patients spécifiques - le but de la médecine de précision.

Analyse systématique et complète des voies d'accès à l'aide de pathDIP

Cela nous amène à une autre ressource que nous avons créée pour la caractérisation complète des profils de cancer : pathDIP. Il est important de noter que cette ressource publique intègre 20 bases de données et permet de prédire par ordinateur l'association des voies de signalisation, étape nécessaire pour bien comprendre les cascades de signaux dans des conditions de santé et de maladie. La validation croisée a permis de déterminer une précision de 71 % de nos prédictions, et les prédictions fournissent de nouvelles annotations pour 5 732 protéines qui n'avaient pas encore été caractérisées.

A partir des résultats de la Figure 2 (les 36 gènes identifiés par mirDIP), le portail pathDIP identifie deux voies significativement enrichies (p < 0,05) : 1) MicroARNs dans le cancer, et 2) Métabolisme central du carbone dans le cancer (base de données KEGG). La première voie confirme directement nos étapes jusqu'à ce point, tandis que la seconde indique un autre chemin d'exploration. En effet, le métabolisme principal du carbone comprend la conversion du glucose en acide lactique, un processus connu sous le nom d'effet Warburg, qui est courant dans les cancers de l'ovaire et d'autres cancers. Il a été démontré que ce processus est contrôlé par l'oxyde nitrique (3) ainsi que par d'autres miARNs (4).

Étude des propriétés anticancéreuses du brocoli
Cependant, pour en revenir à la régulation des microARN - le portail mirDIP nous permet maintenant d'étudier si les microARN provenant d'animaux, de plantes et de virus pourraient réguler les gènes humains. Ce mécanisme de réglementation inter-espèces ouvre un énorme potentiel de compréhension de l'augmentation du risque de maladie et de prévention. Comme première étude dans cette direction, nous avons récemment terminé et publié un article montrant que les microARN du brocoli régulent les gènes humains, régulés à la hausse dans le cancer du poumon, fournissant ainsi une explication potentielle des raisons pour lesquelles la consommation de brocoli a été liée aux propriétés anticancéreuses par de nombreuses études épidémiologiques.

Plusieurs publications connexes
Bien que la plupart de ces publications soient liées à des études sur le cancer ou à des outils et des ressources que nous avons créés, nous continuons également à collaborer avec d'autres chercheurs et à traduire les flux de travail vérifiés de l'informatique du cancer pour aider à résoudre d'autres maladies.

Autres nouvelles
Nous avons terminé la 6e édition de l'événement annuel Team Ian Ride, qui vise à recueillir des fonds pour soutenir la formation de jeunes chercheurs. Ces fonds appuient le prix de la meilleure communication étudiante à la conférence annuelle de l'ISMB, ainsi que des stagiaires estivaux en informatique du cancer.

L'événement appuie également une nouvelle orientation de notre recherche sur l'activité physique et la prévention du cancer, et de nombreux participants de l'équipe de Ian se sont déjà inscrits à nos études expérimentales. Vous pouvez trouver des images sur http://www.cs.utoronto.ca/~juris/TIR2016. N'hésitez pas à nous contacter si vous souhaitez vous impliquer en 2017.


L'équipe Mapping Cancer Markers

  • He,L. and Hannon,G.J. (2004) MicroARNs : petits ARNs avec un grand rôle dans la régulation des gènes. Nat. Rev. Genet., 5, 522–531.
  • Zaman,M.S., Maher,D.M., Khan,S., Jaggi,M., Chauhan,S.C., Siegel,R., Naishadham,D., Jemal,A., Wright,J., Shah,M., et al. (2012) Statut actuel et les implications de microARNs dans le diagnostic de cancer des ovaires et sa thérapie. J. Ovarian Res., 5, 44.
  • Caneba CA, Yang L, Baddour J, Curtis R, Win J, Hartig S, Marini J, Nagrath D. (2014)  L'oxyde nitrique est un régulateur positif de l'effet Warburg dans les cellules cancéreuses ovariennes. Cell Death Dis. 5:e1302.
  • Yue Teng, Yan Zhang, Kai Qu, Xinyuan Yang, Jing Fu, Wei Chen, and Xu Li. (2015) MicroRNA-29B (mir-29b) régule l'effet Warburg dans le cancer de l'ovaire en ciblant AKT2 et AKT3. Oncotarget. 6(38): 40799-S40814.

Si quelqu'un peut relire :jap:

Je crunche dans le silence et c'est ma joie !
Ryzen 1700X/32Go/GTX970 (sous WC) - i7-3770T/16Go/HD4000 - Ryzen 5700G/32Go/GTX1050 - Q9550/8Go/GT1030 - 3xAndroidBox S912