Ce jeu de données contient 74 lignes et 14 colonnes, 2 colonnes sont illustratives, 2 variables qualitatives additionnelles sont illustratives.


1. Observation d’individus extrêmes

La détection des individus extrêmes ne s’applique pas à l’AFC.

2. Distribution de l’inertie

L’inertie des axes factoriels indique d’une part si les variables sont structurées et suggère d’autre part le nombre judicieux de composantes principales à étudier.

Les 2 premiers axes de l’ analyse expriment 96.44% de l’inertie totale du jeu de données ; cela signifie que 96.44% de la variabilité totale du nuage des lignes (ou des colonnes) est représentée dans ce plan. C’est un pourcentage extrêmement élevé, et le premier plan représente donc parfaitement bien la variabilité contenue dans l’ensemble du jeu de données actif. Cette valeur est nettement supérieure à la valeur référence de 31.94%, la variabilité expliquée par ce plan est donc hautement significative (cette intertie de référence est le quantile 0.95-quantile de la distribution des pourcentages d’inertie obtenue en simulant 1958 jeux de données aléatoires de dimensions comparables sur la base d’une distribution uniforme).

Du fait de ces observations, il n’est absolument pas nécessaire pour l’analyse d’interpréter les dimensions suivantes.

Figure 2 - Décomposition de l’inertie totale Le premier facteur est largement prépondérant : il explique a lui seul 91.71% de la variabilité totale des données. Il convient de noter que dans un tel cas, la variabilité liée aux autres composantes peut être dénuée de sens, en dépit d’un pourcentage élevé.

Une estimation du nombre pertinent d’axes à interpréter suggère de restreindre l’analyse à la description des 1 premiers axes. Ces composantes révèlent un taux d’inertie supérieur à celle du quantile 0.95-quantile de distributions aléatoires (91.71% contre 17.73%). Cette observation suggère que seul cet axe est porteur d’une véritable information. En conséquence, la description de l’analyse sera restreinte à ces seuls axes.


3. Description de la dimension 1

Figure 3.1 - Graphe superposé (AFC) Les colonnes en rouge clair sont les colonnes en actif, celles en rouge foncé sont les colonnes supplémentaires (illustratives). Les lignes libellées sont celles ayant la plus grande contribution à la construction du plan. Les colonnes libellées sont celles les mieux représentées sur le plan.

La probabilité critique du test de Wilks indique la variable dont les modalités sépare au mieux les individus sur le plan (i.e. qui explique au mieux les distances entre individus).

##    reg_admin     reg_clim 
## 2.065584e-28 6.006776e-23

La meilleure variable qualitative pour illustrer les distances entre individus sur le plan est la variable : reg_admin.

Figure 3.2 - Graphe superposé (AFC) Les lignes libellées sont celles ayant la plus grande contribution à la construction du plan. Les colonnes libellées sont celles les mieux représentées sur le plan. Les individus sont colorés selon leur appartenance aux modalités de la variable reg_admin.


La dimension 1 oppose des facteurs tels que 2, 27, 4, 9, 53, 18, 12 et 33 (à droite du graphe, caractérisés par une coordonnée fortement positive sur l’axe) à des facteurs comme 66, 50, 46, 22, 32, 49, 67, 40, 47 et 61 (à gauche du graphe, caractérisés par une coordonnée fortement négative sur l’axe).

Le groupe auquel les facteurs 2, 27, 4, 9, 53, 18, 12 et 33 appartiennent (caractérisés par une coordonnée positive sur l’axe) partage :

Le groupe auquel les facteurs 66, 50, 46, 22, 32, 49 et 67 appartiennent (caractérisés par une coordonnées négative sur l’axe) partage :

Le groupe auquel les facteurs 40, 47 et 61 appartiennent (caractérisés par une coordonnées négative sur l’axe) partage :

Notons que les facteurs 1, 2, 3, 4, 8, 9, 10, 12, 13 et 14 sont extrêmement corrélés à cette dimension (corrélations respectives de 0.9, 0.99, 0.92, 0.98, 0.97, 0.98, 0.94, 0.95, 0.94, 0.94, 0.97, 0.98, 0.98, 0.98, 0.99, 0.92, 0.99, 0.98, 0.91, 0.91, 0.93, 0.93, 0.95, 0.99, 0.98, 0.99, 0.93, 0.98, 0.91, 0.95, 0.96, 0.94, 0.97, 0.97, 0.96, 0.97, 0.91, 0.93, 0.96, 0.98, 0.94, 0.91, 0.95, 0.98, 0.95, 0.99, 0.99, 0.95, 0.93, 0.94, 0.96, 0.98, 0.91, 0.98, 0.99). Ces facteurs pourraient donc résumer à eux seuls la dimension 1.


4. Classification

Figure 4 - Classification Ascendante Hiérachique des lignes. La classification réalisée sur les lignes fait apparaître 3 clusters.

La classe 1 est composée de lignes telles que 46, 50, 32, 67, 49, 22, 66, 40, 47 et 7. Ce groupe est caractérisé par :

La classe 2 est composée de lignes telles que 61. Ce groupe est caractérisé par :

La classe 3 est composée de lignes telles que 33, 53, 18, 12, 27, 9, 4 et 2. Ce groupe est caractérisé par :


Annexes