Vincent GODARD

Département de Géographie

Université de Paris 8


V.1.5 - Dernière mise à jour : 10/10/2007

 

Fiche Mémo n°4 d'analyse de données pour le Master 2 :

Les classifications hiérarchiques

 

 

1. Principes

En cours de réalisation !!!

2. Classification faisant suite à une analyse en composantes principales (COPRI)

2.1. Analyse d'un 1er exemple

Exemple n°1 : Tableau 4.1 - La structure pastorale éthiopienne par awrajas (en nombre de têtes), [Sources : EASTMAN (J.R.) - 1997 - 10. Database Workshop. in : IDRISI for Windows. Tutorial Exercises. Version 2.0. Worcester (MA, USA), Clark University, pp. 69-79 et traduction française GODARD, 2003]

Téléchargement du fichier

Ce fichier est au format Excel (.xls) et "pèse" 51 Ko.

 

2.1.1. Procédure d'importation

- Modifier les répertoires par défaut

Menu Option + Paramètres généraux ...

Répertoires utilisés par défaut

Répertoires utilisés par défaut

pour les bases : D:\geo\Votre_Nom\fm18

pour les modèles : D:\geo\Votre_Nom\fm18

pour les filières : D:\geo\Votre_Nom\fm18

zone temporaire : D:\geo\Votre_Nom\temp

les importations : D:\geo\Votre_Nom\fm18

- Importer les données

- Importation du fichier texte

- Base / Importer... / Importation fichier Ascii ...

SPAD demande :

- de localiser le fichier ".txt"

- le format du fichier

- délimité

- séparateur tabulation

- décimale point (il n'y en a pas dans ce tableau !)

- de cocher si la 1ère ligne contient la variable

valider en cochant Suivant

- de définir les variables en :

- Type

avec :

idr_id => Identificateur ;

name => Alphabétique ;

population => Continue ;

cattle => Continue ;

sheep => Continue ;

goats => Continue.

- Libellé

- facultatif, remplace en 60 caractères maxi le titre dans la base

- Code Id.

- option pour les QCM ;

- pour recoder des variables (nominales ou alphabétiques) de même type.

N'hésitez pas à consulter l'Aide !

- d'Exécuter l'importation

- enregistrement de la base au format ".sba"

- si l'importation se passe bien, consulter :

- les statistiques de la bases

- l'édition des résultats

- l'édition du compte-rendu qui signale toutes les anomalies lors de l'importation

- codes inattendus,

- variables transformées, ...

- si l'importation comporte des erreurs :

- la base n'est pas générée

- cliquer sur le bouton "Il y a des erreurs" qui édite le compte rendu ;

- corriger (!!!) puis relancer l'exécution.

- Enfin, cliquer sur OK, puis Fermer.

 

2.1.2. Création de la filière d'analyse

- Ouvrir une filière prédéfinie

Menu Filière + Filière prédéfinie (ou Ctrl + F)

- Sélection d'une filière prédéfinie

- Groupes de filières prédéfinies : Analyses factorielles et classification

- Filières prédéfinies : Analyse en composantes principales

- Valider par OK

- Choisir une base

Filière + Sélectionner base

D:\geo\Votre_nom\fm18\dfm04ta1.sba

 

2.1.2.1. Paramétrage de COPRI

- Méthode + Paramètres ... (ou Shift + F6)

Onglet Variables

- Sélection des variables : Continues actives

=> toutes sauf population

- Sélection des variables : Continues illustratives

=> population

Onglet Individus

- Choix des individus

=> tous

Onglet Pondération

=> Uniforme

Onglet Paramètres

- Paramètres de fonctionnement :

Analyse normée (synonyme de standardisée*)

Coordonnées conservées toutes

- Paramètres d'édition :

Matrice permutée selon F1 Non

Coordonnées éditées toutes

Résultats pour les individus tous

Nombre de décimales 2

- Fichier pour application tableur : Oui

Options pour application tableur :

Résultats pour les individus Oui

Édition pour la matrice analysée Identifiant long

- Valider par OK deux fois

- Méthode + Exécuter méthode (ou Shift + F5)

 

2.1.2.2. Paramétrage de DEFAC

- Méthode + Paramètres ... (ou Shift + F6)

Onglet Commande de description

- Liste des axes à décrire : 1-3

- Avec les éléments :

Variables continues Actives seules

Individus Actifs seuls

Onglet Paramètres

Laisser Défaut

- Méthode + Exécuter méthode (ou Shift + F5)

 

2.1.2.3. Paramétrage de RECIP/SEMIS

- Méthode + Paramètres ... (ou Shift + F6)

Onglet Paramètres

- Choix de la méthode : Hiérarchique (RECIP)

La méthode SEMIS est une méthode mixte pour classer les très grands nombres d'individus.

- Paramètres de fonctionnement :

Coordonnées utilisées pour l'agrégation : Toutes

Sauvegarde partielle de l'arbre (nombre d'éléments terminaux) : 50

- Paramètres d'édition :

Histogramme des indices : 50

Composition des éléments terminaux : Oui

Coordonnées des éléments terminaux : Toutes

Caractéristiques des noeuds : Oui

Dendrogramme (arbre hiérarchique) : Large

- Méthode + Exécuter méthode (ou Shift + F5)

 

2.1.2.4. Paramétrage de PARTI-DECLA

- Méthode + Paramètres ... (ou Shift + F6)

Onglet Choix des partitions

- Recherche automatique des meilleurs partitions :

Nombre de partitions : 3

Nombre minimum de classes par partition : 2

Nombre minimum de classes par partition : 6

Onglet Paramètres de partitionnement

- Paramètres de partitionnement :

Itérations de consolidation : 10

Affectation des individus illustratifs aux classes les plus proches : Oui

- Paramètres d'édition : par défaut

Onglet Caractérisation des partitions

=> par défaut

- Méthode + Exécuter méthode (ou Shift + F5)

 

- Enregistrement et exécution de la filière

- Filière + Enregistrer filière sous ...

D:\geo\Votre_nom\fm18\copri-recip1.fil

Donner un titre "causant", car il apparaîtra sur le bandeau de la fenêtre

- Filière + Exécuter filière (ou F5)

 

2.2. Analyse d'un 2ème exemple

En cours de réalisation !!!

 

Retour au début de la fiche Mémo

 

Fiche Mémo suivante

 

NB : les mots suivis de "*" font partie du vocabulaire statistique, donc leur définition doit être connue. Faites-vous un glossaire.