Self-supervised representation learning from electroencephalography signals. Apprentissage de représentations auto-supervisé à partir de signaux d'électroencéphalographie

Archive ouverte

Banville, Hubert | Albuquerque, Isabela | Hyvärinen, Aapo | Moffat, Graeme | Engemann, Denis-Alexander | Gramfort, Alexandre

Edité par CCSD -

International audience. The supervised learning paradigm is limited by the cost - and sometimes the impracticality - of data collection and labeling in multiple domains. Self-supervised learning, a paradigm which exploits the structure of unlabeled data to create learning problems that can be solved with standard supervised approaches, has shown great promise as a pretraining or feature learning approach in fields like computer vision and time series processing. In this work, we present self-supervision strategies that can be used to learn informative representations from multivariate time series. One successful approach relies on predicting whether time windows are sampled from the same temporal context or not. As demonstrated on a clinically relevant task (sleep scoring) and with two electroencephalography datasets, our approach outperforms a purely supervised approach in low data regimes, while capturing important physiological information without any access to labels. . Le paradigme de l’apprentissage supervisé est limité par le coût - et parfois l’impraticabilité - de la collecte de données et de l’étiquetage dans de multiples domaines. L'apprentissage auto-supervisé, un paradigme qui exploite la structure de données non étiquetées pour créer des problèmes d'apprentissage qui peuvent être résolus avec des approches supervisées standard, s'est révélé très prometteur en tant qu'approche de pré-entraînement ou d'apprentissage de traits caractéristiques dans des domaines tels que la vision par ordinateur et le traitement de séries temporelles. Dans ce travail, nous présentons des stratégies d'auto-supervision pouvant être utilisées pour apprendre des représentations informatives à partir de séries temporelles multivariées. Une approche fructueuse consiste à prédire si des fenêtres temporelles sont échantillonnées dans le même contexte temporel ou non. Comme le démontre une tâche cliniquement pertinente (classification des stades du sommeil) et avec deux jeux de données d'électroencéphalographie, notre approche surpasse une approche purement supervisée dans des régimes de données faibles, tout en capturant des informations physiologiques importantes sans accès aux étiquettes.

Suggestions

Du même auteur

Uncovering the structure of clinical EEG signals with self-supervised learning

Archive ouverte | Banville, Hubert | CCSD

32 pages, 9 figures. International audience. Objective. Supervised learning paradigms are often limited by the amount of labeled data that is available. This phenomenon is particularly problematic in clinically-rele...

Deep learning-based electroencephalography analysis: a systematic review

Archive ouverte | Roy, Yannick | CCSD

International audience

Robust learning from corrupted EEG with dynamic spatial filtering

Archive ouverte | Banville, Hubert | CCSD

International audience. Building machine learning models using EEG recorded outside of the laboratory setting requires methods robust to noisy data and randomly missing channels. This need is particularly great when...

Chargement des enrichissements...