Vincent GODARD

Département de Géographie

Université de Paris 8


V.1.2.5 - Dernière mise à jour : 29/11/2016

 

 

TP n°1 du cours d'analyse de données pour le Master 2 :

Prise en main de l'ACP et du logiciel SPAD V. 8

 


1. Principes généraux de SPAD


Pour partir à la découverte des principes généraux de SPAD 8 :

- Lancez SPAD depuis : Démarrer + Tous les programmes + SPAD 8

Une fois SPAD démarré :

- Cliquez sur le "?" dans la barre des menus + Sommaire de l'aide

- Dans le menu de gauche de la fenêtre d'aide, rendez actif :

SPAD Version 8\Présentation générale

- Dans le menu de droite, cliquez sur :

Le projet SPAD \Un exemple

Laissez vous guider !

 

2. La préparation des données pour une ACP

Exemple : Évaluation de la vulnérabilité socio-économique par rapport aux tempêtes extrêmes et aux inondations qui les accompagnent (Revere, Massachusetts, USA)

fig. 1. Revere Beach, Massachusetts, aux alentours de 1920

  Sources : didacticiel UNITAR

Ce tableau est le support d'un exercice détaillé sur la fiche guide 6.2 du cours d'ADD de Master 2

Téléchargement des données du TP :

Téléchargement du fichier brut

Ce fichier est au format Excel (.xls) et "pèse" 46 Ko.

Téléchargement du fichier résultats

Ce fichier est au format Excel (.xls) et "pèse" 46 Ko.

Pour la cartographie de l'analyse :

- sous ArcGis, récupérer le fichier de formes (shp) et sa base de données dans le revere.rar.

- sous Idrisi, s'inspirer du TD de télédétection "mtd42tel.htm" et particulièrement du passage qui traite de cartographie (à la section 5.5 Cartographie des UEA ) et de l'enregistrement en DBASE ".dbf" qui rend le fichier EXCEL directement importable dans Idrisi.

Le stocker dans votre répertoire de travail (et pas sur le Bureau à la fac !)

Signification des variables :

IDR_ID est l'identifiant des îlots de recensement (census blocks, entités de base)

   1 . Population => nombre d'habitants par îlot de recensement ;
   2 . Elderly => nombre de vieux par  îlot de recensement ;
   3 . Hispanic => nombre d'habitants d'origine hispanique par  îlot de recensement ;
   4 . Poverty => nombre de pauvres par  îlot de recensement ;
   5 . Elderly% => part des vieux par  îlot de recensement ;
   6 . Hispanic% => part des habitants d'origine hispanique par  îlot de recensement ;
   7 . Poverty% => part des pauvres par  îlot de recensement.

- Le tableau EXCEL est-il compatible avec SPAD ?

Vérifier qu'il n'y a pas d'espaces inutiles avant les en-têtes des variables (colonnes) ou des individus (lignes)

 

2.1. La conversion au format .txt

Sous EXCEL :

- Sélectionner les données utiles dans la feuille "Popinfo"

de A1 à H44

Pas de blancs ni de caractères spéciaux dans les intitulés de variables

- Les coller par Collage spécial du menu Edition

en A1 de la feuille "txt"

- Faire un Enregistrer sous du menu Fichier

Le type de fichier doit être en :

Texte (séparateur : tabulation) (*.txt)

L'enregistrer sur le DD dans votre répertoire :

D:\geo\Votre_Nom\revere\dfm01ta2.txt

ou à défaut sur votre clef USB en :

E:\AdD\revere\dfm01ta2.txt

 Cette conversion n'est pas obligatoire, mais le .TXT, tout comme le .CSV sont des formats d'échanges sans fioritures (formules, mise en page...).


2.2. La conversion des données au format SPAD

- Comment passer d'un tableau EXCEL à une base SPAD ?

- Lancer SPAD

- Cocher "Créer un nouveau projet"

- Sélectionner le répertoire :

D:\geo\Votre_Nom\revere\

- Lui donner un nom comme : Revere_ACP1

- Cliquer sur OK.

- Sélectionner dans la fenêtre "Méthodes"

Imports / Exports de données\Imports\Fichier Texte Délimité

- Le faire glisser dans la fenêtre "Diagramme"

- Double-cliquer sur son icône pour la paramétrer

"Fichier texte direct" étant coché

- Sélectionner le fichier texte de la ville de Revere :

D:\geo\Votre_Nom\revere\dfm01ta2.txt

- Cliquer sur OK.

- Laisser les paramètres par défaut.

- Sélectionner l'onglet "Métadonnées" (en bas) pour définir le typage des variables, c'est là que l'on peut :

- choisir ou non d'importer une variable (Impor...) ;

- changer son nom pour les traitements à venir (Nouveau nom) ;

- modifier les caractéristiques de son stockage qui peut être : Autre, Chaîne, Réel, Entier, Date (Cliquer sur Aide pour en savoir plus) ;

- modifier le "Rôle" de la variable IDR_ID de :

Continue/Nominal => Identifiant

- pour Exécuter l'importation cliquer sur OK.

- Pour vérifier que l'exécution s'est bien déroulée, aller voir la fenêtre "Exécutions" et ses différents onglets.

 

3. Création d'une 1ère ACP

3.1. Procédure

- Insertion d'une première méthode

- Sélectionner dans la fenêtre "Méthodes"

- Choisir : Analyse factorielle / ACP - Analyse Composantes principales

- La faire glisser dans la fenêtre "Diagramme"

Ou, dans la fenêtre "Diagramme" :

- Clic droit sur l'icône de "dfm01ta2" puis Ajouter méthode (ou Insérer)

- et choisir Analyse factorielle / ACP - Analyse Composantes principales

Valider avec OK

- Liaison entre le fichier texte "dfm01ta2" et la première méthode

- Passer la souris au dessus de l'icône de "dfm01ta2" ;

- Cliquer gauche en périphérie de l'icône de "dfm01ta2" sur un triangle bleu ;

- Tirer puis déposer la flèche sur la méthode ACP

- Paramétrage d'une première méthode

- Clic droit sur l'icône de la méthode + Paramètres ... (ou F4)

Onglet Variables

- Sélection des variables : Continues actives (statut)

=> toutes

Menu déroulant Variable de pondération

=> Aucune

Onglet Individus

- Choix des individus

=> tous

Onglet Paramètres

- Paramètres de fonctionnement :

Analyse normée

Coordonnées conservées toutes

- Paramètres d'édition :

Matrice permutée selon F1 Non

Coordonnées éditées toutes

Résultats pour les individus tous

Nombre de décimales 2

Pour les versions de SPAD antérieures à la 8.2

- Fichier pour application tableur : Oui

- Cliquer sur Option

Résultats pour les individus Oui

- Valider avec OK

- Contrôler que dans la fenêtre "Exécutions" tout c'est bien passé [coche verte devant "Terminé (ok)"]

- Insertion d'une deuxième méthode

Toujours dans la fenêtre Diagramme :

- Clic droit sur l'icône de "ACP" puis Ajouter méthode (ou Insérer)

- Choisir : Analyse factorielle / Description des facteurs (DEFAC)

- En profiter pour lire le texte d'accompagnement

- Valider avec OK

# ce paramètre "DEFAC" (description des facteurs) est une aide à l'interprétation qui permet de sélectionner ce qui est pertinent (significatif statistiquement) de ce qui ne l'est pas !

- Clic droit sur l'icône de la méthode + Paramètres ... (ou F4)

Onglet Commande de description

- Liste des axes à décrire : 1-7

- Avec les éléments :

Variables continues Actives seules

Individus Actifs seuls

Onglet Paramètres

- Paramètres de fonctionnement (à laisser par défaut) :

- Sélection des éléments pour la description des axes : pourcentage => 50

- Critère de sélection des modalités : valeur-test supérieure en valeur absolue à => 2

- Mode de calcul des valeurs-test : Poids absolu

Pour les versions de SPAD antérieures à la 8.2

Coordonnées conservées toutes

- Paramètres d'édition :

- Fichier pour application tableur : Oui

- Cliquer sur Option

Résultats pour les individus Oui

- Valider avec OK

- Contrôler que dans la fenêtre "Exécutions" tout c'est bien passé [coche verte devant "Terminé (ok)"]

 

3.2. Analyse

3.2.1. Analyse des valeurs de la matrice des corrélations

- Où trouver la matrice des corrélations ?

- Dans l'onglet "Exécutions" :

- Simple clic sur le plan du rapport (Listage) dans "Résultats" en bout d'ACP

- Listage de l'analyse en composantes principales

- Recherche de la matrice des corrélations

- ou plus simple, un simple clic sur l'icône Excel dans "Résultats" en bout d'ACP

- Recherche de la matrice des corrélations => COPRI-2

- Quelles sont les variables corrélées entre elles ?

- Quelle est l'intensité de la liaison ?

- Qu'est-ce que cela signifie ?

- Pour vous y repérer :

- opposer positif / négatif ;

- montée en valeurs en fonction de l'intensité :

Utiliser la fonction "Mise en forme conditionnelle" d'Excel pour faire cette double montée en valeurs.

1) Mettre la matrice des corrélations dans votre PDF avec sa mise en couleurs


- Recherche de la matrice des valeurs-tests => COPRI-3

- Quels liens faites vous avec les valeurs-tests ?

2) Quelle relation faites vous entre une VT>2 et un coefficient de corrélation ?


 

3.2.2. Analyse des valeurs propres

Pour savoir où trouver l'information

- Où trouver les valeurs propres ?

- sur le fichier EXCEL généré par l'exécution => COPRI-4

- ou sur le plan du rapport (listage)

3) Combien d'axes retenir pour totaliser 80% de la variance sur les facteurs ?


3.2.3. Analyse des axes

Objectif : rechercher les associations de variables

Pour caractériser les facteurs

Deux méthodes sont exposées ici :

- statistique

- visuelle


3.2.3.1. Analyse par les statistiques

- Où trouver les informations sur les axes ?

- sur le fichier EXCEL généré par l'exécution => COPRI-6

- ou sur le plan du rapport (listage)


Interprétation :

- Le tableau COORDONNÉES donne la projection des variables sur les 7 axes factoriels.

- On peut constater qu'elles ne sont pas toutes positives sur l'axe 1.

- le nombre de vieux (Elderly) et la part des vieux (Elderly%) par block s'opposent à toutes les autres variables et en particulier aux pauvres et aux hispaniques (coordonnées les plus élevées) ;

On devrait pouvoir dire que : là où il y a des vieux il y a peu d'hispaniques et de pauvres !

4) Que pourrait-on dire de l'axe 2 ?


- Le tableau CORRÉLATIONS VARIABLE-FACTEUR permet d'apprécier la qualité du positionnement des variables sur les 7 axes factoriels.

mais dans SPAD les CORRÉLATIONS VARIABLE-FACTEUR ne sont pas élevées au carré, il faut le faire dans Excel !

=> Vous pouvez vous inspirer des calculs réalisés dans la fichier Excel sur les villes américaines pour calculer la qualité du positionnement (voir : Téléchargement du fichier de résultats, COPRI-6)

- En ACP normée, les Cos2 coïncident avec le carré des coordonnées des variables ;

5) Sur quel axe le Cos2 des "Hispanic" est-il le plus élevé ?

6) Sur quel axe le Cos2 des "Elderly" est-il le plus élevé ?

- Le tableau Anciens axes unitaires donne la contribution des variables à l'inertie portée sur les 7 axes factoriels.

- sert à détecter les variables qui contribuent le plus à la formation des axes ;

- la contribution est :

CTR = (ANCIENS AXES UNITAIRES)2

La somme des contributions (axe vertical) est égale à 1 (ou 100 en pourcentage).

Une variable est dite contributive quand elle dépasse la contribution moyenne (soit 100/nb de variables)

- Pour vous y repérer (à adapter en fonction du tableau calculé par SPAD et le vôtre élevé au carré) :

- opposer positif / négatif ;

- montée en valeurs en fonction de l'intensité :

Utiliser la fonction "Mise en forme conditionnelle" d'Excel pour faire cette double montée en valeurs.

7) Quelles sont les variables les plus contributives sur l'axe 1 ?

8) Quelles sont les variables les plus contributives sur l'axe 2 ?

9) Quel titre donner à l'axe 2 ?


3.2.3.2. Analyse graphique d'un plan factoriel

Dans l'onglet "Exécutions", sur la ligne ACP :
simple clic sur "Éditeur graphique de plans factoriels" (3ème icône en partant de la gauche)

- Menu Graphique/Nouveau

- Présélections pour un nouveau graphique : variables continues actives

Valider par OK

- Menu Sélection/Des catégories/catégories actives

- Menu Habillage/Ecrire les libellés

- Menu Habillage/Informations sur les points

- Cliquer sur chaque pointe de flèches

=> Vous obtenez les cos2, les CTR et avec les signes des coordonnées

Interprétation :

- 2 variables proches forment un angle aigu.

cela correspond à un Coefficient de corrélation positif élevé ;

- 2 variables avec un fort Coefficient de corrélation négatif

sont diamétralement opposées ;

- 2 variables indépendantes auront un Coefficient de corrélation nul

et formeront un angle droit ;

- pratiquement toutes les variables sont négatives sur l'axe 2

le nuage des variables n'est pas centré !

- Affichage d'un autre plan factoriel que le 1 et 2

- Menu Sélection/Déselection totale

- Dans le Menu Habillage

Désélectionner "Informations sur les points"

- Menu Graphique/Changer les axes

Choisir :

axe 1 => horizontal

axe 3 => vertical

10) Mettre le graphique dans votre PDF avec sa mise en couleurs avec l'habillage des points pour les Hispanic%

11) Que pouvez-vous dire des variables "Elderly" et "Elderly%" ?

 

3.2.4. Analyse des individus

Pour caractériser les groupes d'individus

3.2.4.1. Par l'analyse du plan du rapport

- Simple clic sur le plan du rapport

- Listage de l'analyse en composantes principales

- Double clic sur Coordonnées, contributions et cosinus

- Ou plus simple, dans le fichier Excel => COPRI-9
- Quels sont les individus qui qualifient chaque axe ?

Interprétation :

- La colonne "Poids relatif" indique le poids donné à chaque individu (blocks) qui est dans ce cas uniforme (2.326 = 100 / 43).

- La colonne "Distance à l'origine" donne la distance au carré de chaque de chaque individu (blocks) au centre de gravité du nuage. Cela permet de trouver les individus les plus :

- moyens => les plus proches du centre de gravité (24 et 7) ;

- originaux => les plus loin du centre de gravité (36 et 37).

C'est un critère d'originalité !

- Les colonnes de Coordonnées sur les axes donnent la projection des individus (blocks) sur les 7 premiers axes factoriels.

- Les colonnes Contributions (en %) sur les axes donnent la contribution des individus (blocks) à l'inertie portée sur les 7 premiers axes factoriels.

- sert à détecter les individus (blocks) qui contribuent le plus à la formation des axes ;

- Quand la valeur d'une contribution est-elle élevée ?

(quand elle est supérieure à la contribution moyenne)

- si tous les blocks avaient la même contribution, elle tournerait autour de 2,3% (2,326 = 100 / 43) ;

12) Sur le 1er axe, quels sont les blocks qui ont une valeur de contribution réellement élevée ?

13) Sur le 2ème axe, quels sont les blocks qui ont une valeur de contribution réellement élevée ? Est-ce les mêmes ?

La somme des contributions est égale à 100.

- Les colonnes Cosinus carrés sur les axes permettent d'apprécier la qualité du positionnement des individus (blocks) sur les 7 premiers axes factoriels.

- l'addition des Cos2, par plan factoriel, sert à détecter les individus (blocks) qui sont les mieux représentés sur ce sous-espace défini par ces 2 axes ;

- Quand la valeur d'un Cos2 est-elle élevée ?

Là non plus, la réponse n'est pas automatique,

Pour déterminer les individus (blocks) bien représentés, il faut comparer les sommes des Cos2 plan par plan.

14) Sur le 1er plan (axe 1 et 2), quel est le block le mieux représenté entre le block 23 et le block 17 ?

15) Sur quel plan vaut-il mieux étudier le block 22 (quels axes étudier ensemble pour faire ressortir sa singularité ?) ?

La somme du Cos2 atteint 1 dans le meilleur des cas.

 

3.2.4.2. Par l'analyse graphique des Contributions (CTR)

- Modification des Couleurs et symboles

- Simple clic sur le graphique (3ème icône en partant de la gauche)

- Présélections pour un nouveau graphique : individus actifs

Valider par OK

- Menu Sélection + De tous les points => ils virent au rose !

- Menu Habillage + Ecrire les libellés

- Menu Habillage + Couleurs et symboles

Symboles = cercle

Couleur = bleu

Taille proportionnelle = contributions

Valider par OK

- Paramétrage de la proportionnalité

- Menu Dessin + Paramétrer la proportionnalité

Coefficient de proportionnalité = linéaire (par défaut)

Taille minimale des symboles en pixels = 1

Taille maximale des symboles en pixels = 16

Ce paramétrage permet d'accentuer la différence entre individus caractérisés par les axes


16) Collez ce graphique dans votre PDF, avec un titre, etc. Quels sont les 6 blocks les plus contributifs à ce plan factoriel ?

Quitter le graphique sans sauvegarder.

3.2.4.3. Par l'analyse graphique des qualité (Cos2)

- Modification des Couleurs et symboles

- Simple clic sur le graphique (3ème icône en partant de la gauche)

- Présélections pour un nouveau graphique : individus actifs

Valider par OK

- Menu Sélection + De tous les points

- Menu Habillage + Ecrire les libellés

- Menu Habillage + Couleurs et symboles

Symboles = cercle

Couleur = bleu

Taille proportionnelle = cos2

Valider par OK

- Paramétrage de la proportionnalité

- Menu Dessin + Paramétrer la proportionnalité

Taille minimale des symboles en pixels = 1

Taille maximale des symboles en pixels = 16

Ce paramétrage permet d'accentuer la différence entre individus caractérisés par les axes

- Filtrage statistique de la sélection

L'objectif est de restreindre la sélection aux points réellement significatifs

Pour nous : la qualité (cos2)

- Menu Sélection + De tous les points

- Menu Sélection + Filtrage statistique de la sélection

Premier axe = axe 1

Deuxième axe = axe 2

Sélection du bouton cos2

Calcul à partir : du plan actuel

Nombre d'éléments sélectionnés en % = 50%

Ne seront représentées que les blocks qui ont un cos2 qui atteint ou dépasse 50 p.100 sur ce plan factoriel.

Cocher sélection exclusive pour passer en fantômes  les points non retenus

17) Quels sont les points sélectionnés ?

Valider par OK

On ne peut interpréter avec sécurité les proximités entre les villes que si elles sont bien représentées sur le plan factoriel.

C'est le cas, une fois les "fantômes" masqués.

- Ajouter du texte

Pour mettre un titre au graphique ou des titres aux secteurs du plan factoriel

- Menu Dessin + Insérer un texte

Cliquer avec la souris à l'endroit où vous souhaitez insérer le texte

- Saisir le titre du graphique dans la fenêtre d'Édition de texte

Valider par OK

Il est possible de déplacer ou de modifier le texte

- Que faire si vous êtes "sec" pour décrire les plans factoriels (les axes par les variables) ?

18) Incorporez la graphique dans votre PDF avec un titre général et des titres d'axes ?

Allez lire les résultats de la procédure DEFAC

Vous y trouverez les deux variables qui "comptent", axe par axe

- Changer les axes

Pour permettre l'analyse visuelles des autres composantes

- Menu Graphique + Changer les axes

- Choisir pour l'axe horizontal : axe 3

- Choisir pour l'axe vertical : axe 4

Le taux d'inertie sous chaque axe s'affiche

Valider par OK

Ce sont les textes du précédent plan factoriel qui s'affichent :

- Faut-il les modifier ?

N'oubliez pas, à l'issue de chaque analyse, de copier-coller dans votre traitement de textes les documents réalisés. Ils vous permettront d'étayer votre développement, même en l'absence du logiciel.

- Ne faudrait-il pas tester la même analyse en mettant certains blocks en individus illustratifs ?

Refaire tourner une ACP en ce sens, à l'aide d'une nouvelle méthode dans le même projet (ou un nouveau), et comparer !


N'oubliez pas de revenir aux données brutes pour l'analyse et le commentaire.

 

4. Cartographie des axes factoriels

Il s'agit maintenant de cartographier une des composantes de l'ACP réalisée sur les îlots de recensement (census blocks) de Revere.

C'est l'axe 1 qui sera cartographié dans cet exemple décrit pas-à-pas.


4.1. Export des coordonnées des individus

Les îlots de recensement à cartographier sont dans l'onglet COPRI-9 du fichier Excel généré lors de l'exécution de l'ACP.

- Sélectionner dans COPRI-9 de A4 à A47, l'identifiant, et de D4 à D47, les coordonnées sur l'axe 1

- Coller côte-à-côte (Collage spécial / Valeurs, de préférence) dans un nouvel onglet, que vous nommerez Axe1, par exemple, ces deux colonnes.

- Enregistrer votre classeur

- Puis enregistrer votre "feuille de calculs" avec un "Enregistrer-sous" :

- Type : Texte (séparateur : tabulation) (*.txt)

- Nom de fichier : dfm01ta2_Axe1.txt

Objectif : faire une feuille autonome pour l'import dans ArcMap (pas obligatoire, mais plus sûr !)


4.2. Import dans ArcGIS

- Décompresser le fichier de formes (shp) et sa base de données contenus dans le fichier compressé revere.rar, vu au début du TP.

- Lancer ArcMap, avec une carte vierge (.mxd).

Se reporter aux tutoriels de prise en main pour toutes ses étapes si vous maîtrisez mal la procédure.


4.2.1. Ajout des données

- Cliquer sur "Ajouter des données"

- Si ce n'est fait, pour trouver vos données plus facilement, cliquer sur "Connexion à un dossier" pour identifier le chemin d'accès.

- Sélectionner : bgroups2.shp

- Ajouter

- Comme ce fichier de formes n'a pas de fichier de projection associé, un message d'alerte apparaît !

Si vous êtes rigoureux vous pouvez lui en associer un ! Ce n'est pas indispensable pour la suite du TP !

Vous trouverez des informations relatives à la projection utilisée sur le site du US Census Bureau et en particulier dans cette liste de FAQ où vous trouverez des pistes :

All versions of the TIGER/Line Shapefiles, going back to 2008, are entirely in NAD83.

For the 1995 version of the TIGER/Line Files through the 2007 TIGER/Line Shapefiles, the files produced for the 48 contiguous states, the District of Columbia, Alaska, Puerto Rico, and the U.S. Virgin Islands were in NAD83. Prior to 1995, these areas were in NAD27.

Les fichiers origines sont antérieurs à 1995, voir la fiche guide 6.2 (cf. Emani, S., et al. 1993), donc c'est probablement du NAD27 ! Passez par le "Catalogue" pour modifier le système de projections.

- Ne tenez pas compte des "erreurs d'affichage".

 

4.2.2. Jointure

- Faire un clique droit sur bgroups2 dans la table des matières ;

- Ouvrir la table attributaire ;

4 champs apparaissent :

- FID : numérotation des objets importés dans ArcMap de 0 à 58 ;

- Shape : type d'objets (des polygones)

- Rec_Num : numéro des enregistrements des polygones (certains polygones sont associés dans un block de recensement), ils sont uniques ;

- Data_Value : numéro des blocks, ils sont redondants car regroupent plusieurs polygones.

Sélectionner tous les "Data_Value"  de valeur 13  pour voir le block se matérialiser au nord avec 11 polygones sur 59.

Ce sont eux qui serviront de clef de jointure pour associer la table attributaire qui contient les coordonnées de l'axe 1, car ils regroupent les polygones de chaque blocks.

- Ajouter des données :

- dfm01ta2_Axe1.txt

- Sélectionner : bgroups2.shp

- Clic droit

- Jointures et relations / Joindre

Pour joindre les attributs d'une table :

    1. Choisissez dans la couche le champ sur lequel portera la jointure : Data_Value
    2. Choisissez la table à joindre : dfm01ta2_Axe1.txt
    3. Choisissez dans la table champ sur lequel portera la jointure : Identificateur

Le reste par défaut

- Validez

Seul le block 44 doit comporter des <Nul>, le reste doit contenir des valeurs (les coordonnées de l'axe 1).


4.3. Symbologie

- Sélectionner : bgroups2.shp

- Clic droit

Propriétés/Symbologie

- Quelle symbologie (variable visuelle) devez-vous choisir ?

- figurés proportionnels ?

- montées en valeurs ?

- Sélectionner Quantités/Couleurs graduées

- Champs/Valeur : Axe 1

- Dégradé de couleurs : choisir une opposition froid/chaud (double montée en valeurs de part et d'autre du zéro)

- Si l'ordre des couleurs n'est pas "usuel" (chaud pour positif...)

Inversez en cliquant sur Symbole/Retournez les symboles


4.3.1. Nombre de classes

- Combien de classes devez-vous choisir ?

Si vous ne savez pas, allez voir l'une ou l'autre des propositions en mem321car.htm#2.4. !

C'est empirique, mais l'ordre de grandeur est exploitable !

- Toujours dans

Propriétés/Symbologie

- Cliquez sur Classification

Classes : mettez le nombre que vous avez choisi


4.3.2. Discrétisation

- Toujours dans

Propriétés/Symbologie

- Classification

Cliquez sur Classer...

- Quelle méthode de classification devez-vous choisir ?

Si vous ne savez pas, allez voir quelques méthodes de discrétisation ici : en mem321car.htm#2.6. !

Vous pouvez partir des seuils naturels de Jenks et modifier les limites des classes en respectant :

- pour un nombre de classes impair => une couleur "neutre" pour les valeurs de part et d'autres de "0" ;

- pour un nombre de classes pair :

- une montée en valeurs "froide" pour les valeurs inférieures à "0" ;

- une montée en valeurs "chaude" pour les valeurs supérieures à "0" ;

- des paliers les plus "ronds" possibles, à savoir, préférez :

-1.5 à -1.585210

-0.5 à -0.425245

etc.

pour autant que cela ne fasse pas basculer plusieurs blocks d'une classe à l'autre !

- ne modifiez pas les valeurs de paliers minimum et maximum.

Vous mettrez une copie d'écran du menu "Classification" dans votre pdf (avec un nom et un n° de figure, bien sûr !)

Validez par OK

- Toujours dans

Propriétés/Symbologie

- Préparez la présentation de la légende en cliquant sur Etiquette/Format des étiquettes...

- Catégorie : Numérique

- Arrondis : Nombre de décimales => 2 (devrait suffire)

- Dans le tableau sous "Etiquette", modifiez les bornes des classes pour obtenir une présentation conforme aux standards (voir par exemple en mem321car.htm#2.5.).

- En sélectionnant une ligne, puis en cliquant sur Etiquette/Modifier la description...

- vous pouvez accoler des variables (Vieux, Pauvres...) pour qualifier les axes.

Validez par OK


4.4. Mise en page

Basculer du "Mode données" au "Mode mise en page" dans ArcMap


4.4.1 Insertion d'un titre général

Insérer/Titre

En repartant des informations glanées sur la fiche guide 6.2 du cours d'ADD de Master 2, trouver un titre qui réponde aux :

Qui, quoi, où, comment et quand !


4.4.2. Insertion d'une légende

Insérer/Légende...

En repartant de vos traitements d'ACP, trouver un titre qui permette de savoir qu'il s'agit :

- d'une ACP

- de coordonnées de l'axe 1 qui contient ? p.100 de la variance

- que cela a telle signification (regrouper et opposer si possible quelques variables)...

(vous pouvez utiliser Insérer/Texte pour opposer des variables, si vous ne l'avez pas fait avec les étiquettes)


N'oubliez pas de signer et dater votre travail de mettre des sources et éventuellement une échelle (j'en oublie sans doute) !


5. Ce qu'il faut rendre

Communiquez-moi sur la plate-forme Moodle, à la rubrique "TP", un PDF qui contiendra :


5.1. QCM

Les réponses à ce QCM (sous la forme => n° question / lettre) :

Question n°1.1. En consultant la matrice des corrélations et celle des valeurs-tests, quelles sont les valeurs de corrélation significatives (mais dont la relation n'est pas forcément intéressante à étudier !) :

a) -7

d) +5

b) -28

e) +18

c) -36

f) +38

Question n°1.2. En consultant le tableau des contributions (Anciens axes unitaires élevés au carré), quelles sont variables qui sont les plus contributives (dont la contribution dépasse la contribution moyenne par exemple) pour l'axe 1 :

a) Population

d) Poverty

b) Elderly

e) Elderly%

c) Hispanic

f) Hispanic%

Question n°1.3. En consultant le tableau des COS2 (Corrélations de var. actives avec les facteurs, soit coord. élevées au carré), sur quel(s) axe(s) la variable population est-elle la mieux expliquée (représentée) :

a) Axe 1

d) Axe 4

b) Axe 2

e) Axe 5

c) Axe 3

f) Axe 6


5.2. Cartes et graphiques

Insérer les documents suivants préparés pendant ce TP.


5.2.1. Graphiques

Les graphiques suivants :

  1. La matrice des corrélations colorisée dans EXCEL au paragraphe 3.2.1. ;
  2. Le plan factoriel réalisé au point 3.2.3.2. avec sa mise en couleur et "l'habillage des points" pour la variable Hispanic% ;
  3. Le graphique des contributions réalisé au point 3.2.4.2. avec le paramétrage de la proportionnalité ;
  4. Le graphique des qualités (cos2) réalisé au point 3.2.4.3. avec le paramétrage de la proportionnalité et la sélection exclusive.

Vous n'oublierez pas de mettre un titre "parlant" et un n° à chaque figure.


5.2.2. Carte

La carte suivant :

Celle réalisée au chapitre 4. dans ArcMap (ou tout autre logiciel)

Un commentaire de 3-4 lignes pour m'expliquer ce que je dois voir !



 
Retour au début de la fiche Mémo
 
Fiche Mémo suivante

 

NB : les mots suivis de "*" font partie du vocabulaire statistique, donc leur définition doit être connue. Faites-vous un glossaire.