Critères de qualité d'un classifieur généraliste

Archive ouverte

Ducharme, Gilles R.

Edité par CCSD -

This paper considers the problem of choosing a good classifier. For each problem there exist an optimal classifier, but none are optimal, regarding the error rate, in all cases. Because there exists a large number of classifiers, a user would rather prefer an all-purpose classifier that is easy to adjust, in the hope that it will do almost as good as the optimal. In this paper we establish a list of criteria that a good generalist classifier should satisfy. We first discuss data analytic, these criteria are presented. Six among the most popular classifiers are selected and scored according to these criteria. Tables allow to easily appreciate the relative values of each. In the end, random forests turn out to be the best classifiers.-Cet article considère le problème de choisir un bon classifieur. Pour chaque contexte il existe un classifieur optimal selon le critère du taux d'erreur, mais aucun n'est optimal dans tous les cas. Comme il existe de nombreux classi-fieurs, lÕutilisateur préférera souvent choisir un classifieur généraliste, dont l'ajustement et l'exploitation sont à sa portée, en espérant que celui-ci fait presque aussi bien que l'optimal. Cet article établit une liste de critères que devrait rencontrer un bon classifieur généraliste, destiné à être ajusté et utilisé avec un minimum d'intervention humaine. Après avoir introduit l'analytique des données, ces critères sont présentés et commentés. Puis un sous-ensemble de six classifieurs est choisi parmi les plus populaires et des scores leur sont attribués en regard de ces critères. Des tables permettent d'apprécier les résul-tats et facilitent le choix d'un bon classifieur. Le classifieur qui ressort de cet exercice avec les meilleurs scores est la forêt aléatoire et ses variantes.léatoire (random forest) et ses variantes.

Suggestions

Du même auteur

Tree based diagnostic procedures following a smooth test of goodness-of-fit

Archive ouverte | Ducharme, Gilles R. | CCSD

International audience. This paper introduces a statistical procedure, to be applied after a goodness-of-fit test has rejected a null model, that provides diagnostic information to help the user decide on a better m...

Smooths Tests of Goodness-of-fit for the Newcomb-Benford distribution

Archive ouverte | Ducharme, Gilles R. | CCSD

The Newcomb-Benford probability distribution is becoming very popular in many areas using statistics, notably in fraud detection. In such contexts, it is important to be able to determine if a data set arises from this distributio...

Early Alterations in Hippocampal Circuitry and Theta Rhythm Generation in a Mouse Model of Prenatal Infection: Implications for Schizophrenia

Archive ouverte | Ducharme, Gilles R. | CCSD

International audience

Chargement des enrichissements...