Guider l'attention dans les modèles de séquence à séquence pour la prédiction des actes de dialogue

Archive ouverte

Chapuis, Emile | Colombo, Pierre | Manica, Matteo | Varni, Giovanna | Vignon, Emmanuel | Clavel, Chloé

Edité par CCSD -

International audience. La prédiction d’actes de dialogue (AD) basés sur le dialogue conversationnel est un élément clé dans le développement des agents conversationnels. La prédiction précise des AD nécessite une modélisation précise à la fois de la conversation et des dépendances globales des AD. Nous utilisons les approches de séquence à séquence (seq2seq) largement adoptées dans la traduction automatique neurale (NMT) pour améliorer la modélisation de la séquentialité des AD. Les modèles seq2seq sont connus pour apprendre les dépendances globales complexes alors que les approches actuellement proposées utilisant des champs aléatoires conditionnels linéaires (CRF) ne modélisent que les dépendances locales des AD. Dans ce travail, nous introduisons un modèle seq2seq adapté à la classification AD en utilisant : un codeur hiérarchique, un nouveau mécanisme attention guidée et la recherche de faisceau appliquée à la fois à l’apprentissage et à l’inférence. Par rapport à l’état de l’art, notre modèle ne nécessite pas de caractéristiques artisanales et est formé de bout en bout. En outre, l’approche proposée obtient un score de précision inégalé de 85% pour la SwDA et un score de précision de pointe de 91,6% pour la MRDA.

Suggestions

Du même auteur

Heavy-tailed Representations, Text Polarity Classification & Data Augmentation

Archive ouverte | Jalalzai, Hamid | CCSD

The dominant approaches to text representation in natural language rely on learning embeddings on massive corpora which have convenient properties such as compositionality and distance preservation. In this paper, we develop a nov...

Automatic Text Evaluation through the Lens of Wasserstein Barycenters

Archive ouverte | Colombo, Pierre | CCSD

International audience. A new metric BaryScore to evaluate text generation based on deep contextualized embeddings (e.g., BERT, Roberta, ELMo) is introduced. This metric is motivated by a new framework relying on op...

TURIN: A coding system for Trust in hUman Robot INteraction

Archive ouverte | Hulcelle, Marc | CCSD

International audience

Chargement des enrichissements...