On considère un ensemble Ω = ( x 1 , … , x n ) {\displaystyle \Omega =(x_{1},\dots ,x_{n})} d'individus et un ensemble H = { H 1 , … , H g } {\displaystyle H=\{H_{1},\dots ,H_{g}\}} de parties de Ω {\displaystyle \Omega } . H est une hiérarchie sur Ω {\displaystyle \Omega } si et seulement si :
∅ ∈ H {\displaystyle \emptyset \in H} . quel que soit i , { x i } ∈ H {\displaystyle \{x_{i}\}\in H} . Ω ∈ H {\displaystyle \Omega \in H} . quels que soient k et ℓ {\displaystyle \ell } , H k ∩ H ℓ = ∅ {\displaystyle H_{k}\cap H_{\ell }=\emptyset } ou H k ⊂ H ℓ {\displaystyle H_{k}\subset H_{\ell }} ou H ℓ ⊂ H k {\displaystyle H_{\ell }\subset H_{k}} . Par exemple, pour un ensemble Ω = ( x 1 , x 2 , x 3 , x 4 ) {\displaystyle \Omega =(x_{1},x_{2},x_{3},x_{4})} l'ensemble
H = { ∅ , { x 1 } , { x 2 } , { x 3 } , { x 4 } , { x 1 , x 2 } , { x 3 , x 4 } , { x 1 , x 2 , x 3 , x 4 } } {\displaystyle H=\left\{\ \emptyset \ ,\{x_{1}\},\{x_{2}\},\{x_{3}\},\{x_{4}\},\{x_{1},x_{2}\},\{x_{3},x_{4}\},\{x_{1},x_{2},x_{3},x_{4}\}\right\}}
est une hiérarchie.
On appelle indice sur un hiérarchie H de Ω {\displaystyle \Omega } une fonction i de H ∖ { ∅ } {\displaystyle H\backslash \left\{\ \emptyset \ \right\}} dans R + {\displaystyle \mathbb {R} ^{+}} vérifiant les propriétés :
si H k ⊂ H ℓ {\displaystyle H_{k}\subset H_{\ell }} et k ≠ ℓ {\displaystyle k\neq \ell } , alors, i ( H k ) < i ( H ℓ ) {\displaystyle i(H_{k})<i(H_{\ell })} . quel que soit x i {\displaystyle x_{i}} de Ω {\displaystyle \Omega } , i ( { x i } ) = 0 {\displaystyle i(\{x_{i}\})=0} . Le couple ( H , i ) {\displaystyle (H,i)} est alors appelé hiérarchie indexée .
Dans le cas de données continues, la fonction d'inertie définit un indice. En considérant l'exemple précédent et en considérant que les points x i {\displaystyle x_{i}} sont des points de R 2 {\displaystyle \mathbb {R} ^{2}} de coordonnées
x 1 = ( 1 , 0 ) {\displaystyle x_{1}=(1,0)\,} x 2 = ( 1 , 0.5 ) {\displaystyle x_{2}=(1,0.5)\,} x 3 = ( 2 , 2 ) {\displaystyle x_{3}=(2,2)\,} x 4 = ( 2 , 2.2 ) {\displaystyle x_{4}=(2,2.2)\,} La fonction d'inertie prend les valeurs suivantes :
i ( { x 1 } ) = 0 {\displaystyle i\left(\{x_{1}\}\right)=0\,} i ( { x 2 } ) = 0 {\displaystyle i\left(\{x_{2}\}\right)=0\,} i ( { x 3 } ) = 0 {\displaystyle i\left(\{x_{3}\}\right)=0\,} i ( { x 4 } ) = 0 {\displaystyle i\left(\{x_{4}\}\right)=0\,} i ( { x 1 , x 2 } ) = 1.125 {\displaystyle i\left(\{x_{1},x_{2}\}\right)=1.125\,} i ( { x 3 , x 4 } ) = 0.2 {\displaystyle i\left(\{x_{3},x_{4}\}\right)=0.2\,} i ( { x 1 , x 2 , x 3 , x 4 } ) = 4.5674 {\displaystyle i\left(\{x_{1},x_{2},x_{3},x_{4}\}\right)=4.5674\,} Une telle hiérarchie peut être représentée par le dendrogramme suivant :