Boosting

Le boosting est un domaine de l'apprentissage automatique (branche de l'intelligence artificielle). C'est un principe qui regroupe de nombreux algorithmes qui s'appuient sur des ensembles de classifieurs binaires : le boosting optimise leurs performances.

Le principe est issu de la combinaison de classifieurs (appelés également hypothèses). Par itérations successives, la connaissance d'un classifieur faible - weak classifier - est ajoutée au classifieur final - strong classifier.

On appelle apprenant faible un algorithme qui fournit des classifieurs faibles, capables de reconnaître deux classes au moins aussi bien que le hasard ne le ferait (c’est-à-dire qu'il ne se trompe pas plus d'une fois sur deux en moyenne, si la distribution des classes est équilibrée). Le classifieur fourni est pondéré par la qualité de sa classification : mieux il classe, plus il sera important. Les exemples mal classés sont boostés pour qu'ils aient davantage d'importance vis-à-vis de l'apprenant faible au prochain tour, afin qu'il pallie le manque.

Un des algorithmes les plus utilisés en boosting s'appelle AdaBoost, abréviation de adaptative boosting.

Le boosting s'appuie sur la théorie de l'apprentissage PAC.

Principales méthodes liées au boosting

[modifier | modifier le code]

La méthode AdaBoost peut être vue comme un cas particulier de la méthode des poids multiplicatifs.

Autres méthodes apparentées

[modifier | modifier le code]
  • ADDEMUP
  • arcing : adaptive recombination of classifiers
  • bagging : bootstrap aggregation
  • bag-stacking : bagging plus stacking
  • cascading
  • combination of classifiers
  • committees of networks
  • consensus theory
  • cragging : cross aggregation (like k-fold cross validation)
  • dagging : disjoint-sample aggregation
  • dag-stacking : dagging plus stacking
  • classifieurs basé sur le principe diviser pour régner (divide and conquer)
  • hagging : half-sample aggregation
  • mélange d'experts (en)
  • multiple classifier systems
  • classifieurs multi-stage et multi-level
  • OLC : optimal linear combination
  • pandemonium of reflective agents
  • sieving algorithms
  • stacking : utiliser les sorties de plusieurs modèles (avec en option les entrées initiales) comme entrées d'un nouveau modèle (de deuxième niveau)
  • voting