PIntMF : Une méthode de factorisation matricielle pénalisée pour l'intégration de données multi-omiques

Archive ouverte

Pierre-Jean, Morgane | Mauger, Florence | Deleuze, Jean-François | Le Floch, Edith

Edité par CCSD -

International audience. The generation of multi-omics data is growing with the improvement of high-throughput technologies. The integration in the same analysis of several levels of the genome could allow a better understanding of diseases or biological systems. Here, we propose a non-supervised penalized matrix factorization method to integrate multi-omics data which aims to identify new groups of individuals within the same disease, as well as relevant markers leading to this classification. We applied this method to simulated data and compared its performances with existing integrative unsupervised methods. Our method leads to a correct clustering of individuals and identifies relevant biomarkers with more precision. The results on real data highlight a new clustering linked to the patient's survival. . La génération de données multi-omiques est en pleine expansion avec l'amélioration des technologies à haut débit. L'intégration au sein d'une seule analyse de plusieurs sources d'information du génome pourrait permettre une meilleure compréhension des maladies ou des systèmes biologiques. Nous proposons ici une méthode non-supervisée de factorisation matricielle pénalisée multi-blocs pour intégrer des données multi-omiques. Cette méthode a pour but d'identifier de nouveaux groupes d'individus au sein d'une même maladie ainsi que d'identifier les variables pertinentes conduisantà cette classification. Nous avons appliqué cette méthode sur des données simulées pour comparer ses performancesà des méthodes intégratives non-supervisées existantes et sur des données réelles. Cette nouvelle méthode permet de bien classer les individus et d'identifier les variables liées aux groupes avec plus de précision. Sur les données réelles, la méthode permet d'établir une nouvelle classification qui a un lien avec la survie des patients.

Suggestions

Du même auteur

PIntMF: Penalized Integrative Matrix Factorization method for multi-omics data

Archive ouverte | Pierre-Jean, Morgane | CCSD

International audience. Motivation:It is more and more common to explore the genome at diverse levels and not only at a single omic level. Through integrative statistical methods, omics data have the power to reveal...

Clustering and variable selection evaluation of 13 unsupervised methods for multi-omics data integration

Archive ouverte | Pierre-Jean, Morgane | CCSD

International audience. Recent advances in NGS sequencing, microarrays and mass spectrometry for omics data production have enabled the generation and collection of different modalities of high-dimensional molecular...

Comparison of commercially available whole-genome sequencing kits for variant detection in circulating cell-free DNA

Archive ouverte | Mauger, Florence | CCSD

International audience. Circulating cell-free DNA (ccfDNA) has great potential for non-invasive diagnosis, prognosis and monitoring treatment of disease. However, a sensitive and specific whole-genome sequencing (WG...

Chargement des enrichissements...