Ce jeu de données contient 90 lignes et 3 colonnes, 2 variables qualitatives additionnelles sont illustratives.


1. Observation d’individus extrêmes

La détection des individus extrêmes ne s’applique pas à l’AFC.

2. Distribution de l’inertie

L’inertie des axes factoriels indique d’une part si les variables sont structurées et suggère d’autre part le nombre judicieux de composantes principales à étudier.

Les 2 premiers axes de l’ analyse expriment 100% de l’inertie totale du jeu de données ; cela signifie que 100% de la variabilité totale du nuage des lignes (ou des colonnes) est représentée dans ce plan. L’inertie observée sur le premier plan factoriel est inférieure à la valeur référence de 100%, et donc faible en comparaison (cette intertie de référence est le quantile 0.95-quantile de la distribution des pourcentages d’inertie obtenue en simulant 314 jeux de données aléatoires de dimensions comparables sur la base d’une distribution uniforme). Toutefois, l’inertie observée sur la première composante principale est supérieure à la référence de 62.49%. Bien que la significativité de l’inertie projetée sur le plan soit insuffisante, celle expliquée par le premier axe est malgré tout significative.

Figure 2 - Décomposition de l’inertie totale Le premier facteur est prépondérant : il explique a lui seul 73.61% de la variabilité totale des données. Il convient de noter que dans un tel cas, la variabilité liée aux autres composantes peut être dénuée de sens, en dépit d’un pourcentage élevé.

Une estimation du nombre pertinent d’axes à interpréter suggère de restreindre l’analyse à la description des 1 premiers axes. Ces composantes révèlent un taux d’inertie supérieur à celle du quantile 0.95-quantile de distributions aléatoires (73.61% contre 62.49%). Cette observation suggère que seul cet axe est porteur d’une véritable information. En conséquence, la description de l’analyse sera restreinte à ces seuls axes.


3. Description de la dimension 1

## Warning: ggrepel: 1 unlabeled data points (too many overlaps). Consider
## increasing max.overlaps

Figure 3.1 - Graphe superposé (AFC) Les lignes libellées sont celles ayant la plus grande contribution à la construction du plan. Les colonnes libellées sont celles les mieux représentées sur le plan.

La probabilité critique du test de Wilks indique la variable dont les modalités sépare au mieux les individus sur le plan (i.e. qui explique au mieux les distances entre individus).

##          Nu2          Reg 
## 6.498595e-19 1.867762e-16

La meilleure variable qualitative pour illustrer les distances entre individus sur le plan est la variable : Nu2.

Figure 3.2 - Graphe superposé (AFC) Les lignes libellées sont celles ayant la plus grande contribution à la construction du plan. Les colonnes libellées sont celles les mieux représentées sur le plan. Les individus sont colorés selon leur appartenance aux modalités de la variable Nu2.


La dimension 1 oppose des facteurs tels que 59, 57, 67 et 76 (à droite du graphe, caractérisés par une coordonnée fortement positive sur l’axe) à des facteurs comme 45, 60 et 110 (à gauche du graphe, caractérisés par une coordonnée fortement négative sur l’axe).

Le groupe auquel les facteurs 59, 57, 67 et 76 appartiennent (caractérisés par une coordonnée positive sur l’axe) partage :

Le groupe auquel les facteurs 45, 60 et 110 appartiennent (caractérisés par une coordonnées négative sur l’axe) partage :

Notons que les facteurs 7, 10, 12, 14, 16, 17, 18, 21, 22 et 23 sont extrêmement corrélés à cette dimension (corrélations respectives de 0.95, 0.98, 0.97, 0.98, 0.99, 0.99, 0.95, 1, 0.98, 0.95, 0.91, 0.9, 1, 0.91, 0.98, 0.94, 0.98, 1, 0.98, 0.91, 0.99, 0.93, 0.94, 0.99, 0.97, 0.9, 0.92, 0.98, 0.91, 0.94, 0.99, 0.97, 0.94, 0.97, 1, 0.95, 1, 0.99, 0.93, 0.96, 1, 0.95, 0.91, 0.99, 0.95, 0.95, 0.97, 0.97, 1, 0.99, 0.92, 0.95, 0.99, 0.95). Ces facteurs pourraient donc résumer à eux seuls la dimension 1.


4. Classification

Figure 4 - Classification Ascendante Hiérachique des lignes. La classification réalisée sur les lignes fait apparaître 3 clusters.

La classe 1 est composée de lignes telles que 24. Ce groupe est caractérisé par :

La classe 2 est composée de lignes telles que 45, 110, 60, 76, 59 et 57. Ce groupe est caractérisé par :

La classe 3 est composée de lignes telles que 64, 21, 51, 39, 25, 88, 70, 55, 54 et 67. Ce groupe est caractérisé par :


Annexes