Un exemple de corpus annoté en diachronie longue : le corpus Democrat, enjeux et exploitations

Archive ouverte

Glikman, Julie | Landragin, Frédéric | Todirascu, Amalia | Schnedecker, Catherine

Edité par CCSD -

International audience. Le corpus DEMOCRAT, constitué dans le cadre du projet ANR de même nom , dont il constitue l’un des livrables, est un corpus de textes annotés en chaînes de référence. Chaque élément référentiel (un ‘maillon’) est indiqué par un identifiant rapportant à son référent, ce qui permet la création d’une chaîne rassemblant toutes les mentions d’un même référent. En outre, le corpus bénéficie également d’une annotation en partie du discours. Ce corpus a déjà fait l’objet de plusieurs exploitations. À l’occasion de ce colloque, nous souhaitons mettre en avant les défis méthodologiques en jeu lors de la constitution d’un tel corpus. Nous montrerons ainsi que, malgré les difficultés inhérentes à un tel projet, les exploitations du corpus Democrat en diachronie longue permettent d’obtenir des résultats convaincants.

Consulter en ligne

Suggestions

Du même auteur

Reference chains in the Democrat corpus: a long-diachronic analysis. Chaînes de référence dans le corpus Democrat : une analyse en diachronie longue

Archive ouverte | Landragin, Frédéric | CCSD

International audience. The Democrat corpus, which is annotated with referring expressions and reference chains, was published at the end of 2019 and has already been the subject of several studies. Three years late...

Les chaînes de référence dans les textes encyclopédiques du 12e au 21e siècle : étude longitudinale

Archive ouverte | Oberle, Bruno | CCSD

International audience

Les chaînes de référence dans les textes encyclopédiques du 12e au 21e siècle : étude longitudinale

Archive ouverte | Oberlé, Bruno | CCSD

International audience

Chargement des enrichissements...