Ce jeu de données contient 74 lignes et 12 colonnes.
La détection des individus extrêmes ne s’applique pas à l’AFC.
L’inertie des axes factoriels indique d’une part si les variables sont structurées et suggère d’autre part le nombre judicieux de composantes principales à étudier.
Les 2 premiers axes de l’ analyse expriment 52.47% de l’inertie totale du jeu de données ; cela signifie que 52.47% de la variabilité totale du nuage des lignes (ou des colonnes) est représentée dans ce plan. C’est un pourcentage assez important, et le premier plan représente donc convenablement la variabilité contenue dans une grande part du jeu de données actif. Cette valeur est nettement supérieure à la valeur référence de 32.27%, la variabilité expliquée par ce plan est donc hautement significative (cette intertie de référence est le quantile 0.95-quantile de la distribution des pourcentages d’inertie obtenue en simulant 1447 jeux de données aléatoires de dimensions comparables sur la base d’une distribution uniforme).
Du fait de ces observations, il serait tout de même probablement préférable de considérer également dans l’analyse les dimensions supérieures ou égales à la troisième.
Figure 2 - Décomposition de l’inertie totale
Une estimation du nombre pertinent d’axes à interpréter suggère de restreindre l’analyse à la description des 2 premiers axes. Ces composantes révèlent un taux d’inertie supérieur à celle du quantile 0.95-quantile de distributions aléatoires (52.47% contre 32.27%). Cette observation suggère que seuls ces axes sont porteurs d’une véritable information. En conséquence, la description de l’analyse sera restreinte à ces seuls axes.
Figure 3.1 - Graphe superposé (AFC) Les lignes libellées sont celles ayant la plus grande contribution à la construction du plan. Les colonnes libellées sont celles les mieux représentées sur le plan.
La dimension 1 oppose des facteurs tels que 50, 62, 22, 66 et 67 (à droite du graphe, caractérisés par une coordonnée fortement positive sur l’axe) à des facteurs comme 27, 69, 18 et 9 (à gauche du graphe, caractérisés par une coordonnée fortement négative sur l’axe).
Le groupe auquel les facteurs 50, 62, 22, 66 et 67 appartiennent (caractérisés par une coordonnée positive sur l’axe) partage :
Le groupe auquel les facteurs 27, 69, 18 et 9 appartiennent (caractérisés par une coordonnées négative sur l’axe) partage :
La dimension 2 oppose des facteurs tels que 74, 70, 64, 24 et 40 (en haut du graphe, caractérisés par une coordonnées fortement positive sur l’axe) à des facteurs comme 16, 23 et 60 (en bas du graphe, caractérisés par une coordonnées fortement négative sur l’axe).
Le groupe auquel les facteurs 74, 70, 64, 24 et 40 appartiennent (caractérisés par une coordonnée positive sur l’axe) partage :
Le groupe auquel les facteurs 16, 23 et 60 appartiennent (caractérisés par une coordonnées négative sur l’axe) partage :
Figure 4 - Classification Ascendante Hiérachique des lignes. La classification réalisée sur les lignes fait apparaître 3 clusters.
La classe 1 est composée de lignes telles que 58, 18, 69, 27, 9, 38, 60 et 23. Ce groupe est caractérisé par :
La classe 2 est composée de lignes telles que 70, 40, 24, 64 et 74. Ce groupe est caractérisé par :
La classe 3 est composée de lignes telles que 16, 22, 50, 66, 62 et 67. Ce groupe est caractérisé par :
res.hcpc$desc.var
$`1`
Intern % glob % Intern freq Glob freq p.value v.test
P_janv 11.458142 8.404815 2801.0 4956.0 6.505656e-110 22.274669
P_octo 13.109161 10.229589 3204.6 6032.0 1.876744e-82 19.235240
P_nove 15.878587 14.122497 3881.6 8327.5 1.467574e-24 10.229180
P_mars 7.795300 6.788974 1905.6 4003.2 5.658690e-16 8.096449
P_fevr 10.777444 9.840553 2634.6 5802.6 1.904818e-10 6.368825
P_avri 4.083778 3.756728 998.3 2215.2 5.187123e-04 3.470902
P_mai 7.663169 9.135912 1873.3 5387.1 6.318549e-26 -10.529476
P_sept 5.471764 7.588415 1337.6 4474.6 4.310742e-62 -16.628810
P_aou 3.531938 6.683320 863.4 3940.9 8.973002e-158 -26.761916
P_juil 1.377350 4.904844 336.7 2892.2 1.961176e-285 -36.104023
$`2`
Intern % glob % Intern freq Glob freq p.value v.test
P_mai 14.946682 9.135912 2188.0 5387.1 3.057727e-158 26.802056
P_juil 7.199410 4.904844 1053.9 2892.2 1.107374e-45 14.186707
P_juin 11.765389 9.479668 1722.3 5589.8 2.144439e-26 10.630723
P_sept 8.808159 7.588415 1289.4 4474.6 3.033534e-10 6.297055
P_avri 4.262674 3.756728 624.0 2215.2 2.682523e-04 3.644174
P_mars 6.167214 6.788974 902.8 4003.2 4.807592e-04 -3.491254
P_janv 6.762896 8.404815 990.0 4956.0 3.733843e-17 -8.420969
P_aou 5.055777 6.683320 740.1 3940.9 9.571915e-21 -9.340678
P_nove 11.621934 14.122497 1701.3 8327.5 1.995973e-24 -10.199353
P_fevr 7.213755 9.840553 1056.0 5802.6 8.475033e-37 -12.671797
P_dece 6.369418 9.064685 932.4 5345.1 6.875488e-42 -13.560406
$`3`
Intern % glob % Intern freq Glob freq p.value v.test
P_aou 11.756363 6.683320 2337.4 3940.9 1.569167e-253 34.010297
P_juil 7.552560 4.904844 1501.6 2892.2 3.033770e-94 20.595145
P_sept 9.292828 7.588415 1847.6 4474.6 6.694570e-28 10.949324
P_dece 10.811790 9.064685 2149.6 5345.1 3.104751e-25 10.378544
P_fevr 10.622674 9.840553 2112.0 5802.6 6.597130e-06 4.506289
P_mars 6.009456 6.788974 1194.8 4003.2 5.809952e-08 -5.424554
P_avri 2.982094 3.756728 592.9 2215.2 5.899538e-13 -7.202784
P_juin 7.654160 9.479668 1521.8 5589.8 4.820864e-28 -10.979027
P_mai 6.668343 9.135912 1325.8 5387.1 3.399680e-52 -15.202579
P_janv 5.859571 8.404815 1165.0 4956.0 7.071204e-60 -16.320365
P_octo 6.985716 10.229589 1388.9 6032.0 2.771089e-81 -19.095141
attr(,"class")
[1] "descfreq" "list "
Figure 5 - Liste des variables caractéristiques des clusters de la classification.