Vincent GODARD

Département de Géographie

Université de Paris 8


Fiche Guide du TD n°12 du cours de Télédétection niveau 2 :

Les classifications supervisées

 

 

Chaque catégorie d'occupation du sol a une signature spectrale qui lui est propre.

On va demander au logiciel de rechercher dans l'image les pixels les plus proches d'une signature type.

 

- Les étapes d'une classification supervisée sont les suivantes :

  1. Localisation de parcelles représentatives de chaque catégorie d'occupation du sol sur l'image (appelées parcelles d'entraînement) ;
  2. Vectorisation des polygones autour de chaque parcelle avec assignation d'un identifiant unique pour chaque classe d'occupation du sol ;
  3. Analyse des pixels inclus dans les parcelles d'entraînement et création d'un fichier de signatures spectrales pour chaque catégorie d'occupation du sol ;
  4. Classification de l'ensemble des pixels de l'image par comparaison de la signature spectrale de chacun par rapport à celle du fichier des signatures témoins.

 

1. Création des sites d'entraînement

La figure n°1 montre la localisation des différentes catégories d'occupation du sol.

Cette reconnaissance relève normalement d'un plan d'échantillonnage.

fig. 1 - Parcelles d'entraînement pour la classification supervisée (fichier H874S)


Source : EASTMAN 1997 p.94

a) A chaque type de couvert d'occupation du sol sera assigné un identifiant entier unique.

A chaque type peut correspondre une ou plusieurs parcelles d'entraînement.

- Pour utiliser ensuite la palette qualitative par défaut d'IDRISI, respecter les numéros suivants:

  1. Shallow water (eaux peu profondes)
  2. Deep water (eaux profondes)
  3. Agriculture
  4. Urban (zones urbanisées)
  5. Deciduous (feuillus)
  6. Coniferous (résineux)

- Pour vectoriser les parcelles d'entraînement, il faut :

b) Afficher le fichier H874S avec la palette Grey 256

- Pour vectoriser la 1ère parcelle d'entraînement :

- Sélectionner l'outil de vectorisation à l'écran à l'aide de l'icône suivante :

- Créer un fichier vecteur appelé TRSITES (par exemple)

- en mode Polygon

- entrer le numéro de l'identifiant (le 2 de l'eau profonde pour commencer, par exemple)

- valider

- Commencer la vectorisation avec le bouton de gauche

- Terminer avec celui de droite

- Choisir des pixels homogènes (ne pas mélanger l'eau et la berge ...)

- Pour annuler, utiliser l'icône suivante :

- Pour vectoriser la 2e parcelle d'entraînement :

- Re-sélectionner l'outil de vectorisation à l'écran

- Garder le même identifiant si c'est un autre polygone du même thème

- Sinon changer le !

- Combien doit-il y avoir de pixels d'entraînement par thème ?

En règle générale, il faut pour chaque thème :

10 fois le nombre de bandes d'enregistrement du capteur

- Pour SPOT 4 => 10 * 4 pixels, soit 40 pixels par thème

- Pour TM => 10 * 7 pixels, soit 70 pixels par thème, etc.

c) Une fois tous les polygones de chaque thème vectorisés, il faut sauver le fichier à l'aide de l'icône suivante :

- Afficher TRSITES sur H874S

 

Il faut maintenant créer les informations statistiques concernant les réflectances spectrales de chaque parcelle d'entraînement.

 

2. Création du fichier de signatures spectrales

d) Lancer MAKESIG depuis le menu Analysis/Image Processing/Signature Development

- Choisir :

- comme type de fichier d'entraînement => Vector

- son nom => TRSITES

- le nombre de bandes => 7

- le nom des bandes à traiter :

- Band1 => H87TM1

- Band2 => H87TM2

- Band3 => H87TM3

- Band4 => H87TM4

- Band5 => H87TM5

- Band6 => H87TM6

- Band7 => H87TM7

valider par Continue ...

Pour en savoir plus sur le capteur TM de Landsat ...

- entrer le nom des catégories d'occupation du sol (8 caractères maxi)

  1. E_peu_pr
  2. Eau_prof
  3. Agricult
  4. Zon_urba
  5. Feuillus
  6. Resineux

    valider par OK

e) Vérifier l'existence du fichier des signatures par LIST du menu File

 

3. Comparaison des fichiers de signatures spectrales types

f) Lancer SIGCOMP depuis le menu Analysis/Image Processing/Signature Development

- choisir de comparer 6 fichiers de signatures

- entrer leur nom

- choisir de comparer leur moyenne

- Quel est le canal qui permet le mieux de différencier les "végétations" ?

g) Lancer à nouveau SIGCOMP

- choisir cette fois-ci de ne comparer que :

- les zones urbanisées (4)

- les conifères (6)

- entrer leur nom

- choisir de comparer leur moyenne plus le minimum et le maximum

Il y a chevauchement pour certaines bandes

=> signe de confusion radiométrique dans les parcelles tests

- Dans quelle signature relève-t-on la plus forte variabilité (dispersion des signatures) ?

- Pourquoi ?

h) Pour en apprendre plus sur les signatures des parcelles tests, il faut lancer EDITSIG depuis le menu Analysis/Image Processing/Signature Development.

- choisir :

- d'éditer la signature des conifères (6)

- de visualiser l'histogramme d'H87TM1

- Quelle est la forme de l'histogramme des valeurs spectrales des pixels d'entraînement ?

- Une forme en cloche => les pixels d'entraînement sont homogènes spectralement

- Une forme bimodale => les pixels d'entraînement représentent deux populations spectrales

- Des individus isolés => les pixels d'entraînement ne sont pas homogènes spectralement

- choisir :

- d'éditer la signature des eaux peu profondes (1)

- de visualiser l'histogramme d'H87TM4

- Pourquoi l'histogramme est-il bimodal dans ce canal ?

- Pour faciliter la mise en route des classifications, il faut réaliser un fichier des signatures groupées.

C'est un fichier ASCII avec une extension en ".sgf".

i) Lancer Edit depuis le menu Data entry ou à l'aide de l'icône suivante :

- cocher Signature group file ;

- entrer un nouveau nom => SIGS ;

- cocher Use Group file editor ;

Valider par OK.

- Sélectionner les fichiers de signatures dans l'ordre précédemment défini :

  1. E_peu_pr
  2. Eau_prof
  3. Agricult
  4. Zon_urba
  5. Feuillus
  6. Resineux

valider par OK

Le même fichier peut être créé par l'éditeur standard de Window.

Il aura la structure suivante :

6

E_peu_pr

Eau_prof

Agricult

Zon_urba

Feuillus

Resineux

Avec le fichier des signatures groupées, nous atteignons la dernière étape des processus de classification.

 

4. Comparaison de quelques méthodes "robustes" de classification (hard classifier)

Chaque pixel de l'image a une valeur dans chacune des bandes enregistrées, c'est sa signature.

Elle va être comparée au fichier des parcelles d'entraînement à l'aide de différents algorithmes de classification*.

 

4.1. Classification par la méthode de la distance minimum

4.1.1. Principe

- Procédure :

- à l'aide des parcelles d'entraînement, l'algorithme de classification :

- calcule

- la moyenne des valeurs spectrales :

- de chaque catégorie d'occupation du sol ;

- dans chaque bande du capteur.

- la distance de chacun des pixels de l'image à chaque moyenne

- affecte chaque pixel au groupe dont la moyenne lui est la plus proche.

La distance utilisée est la distance euclidienne.

- La figure 2 illustre ce concept :

fig. 2 - Histogramme bidimensionnel représentant la moyenne de chaque catégorie


Source : LILLESAND et KIEFFER - 1979 - Remote Sensing and Image Interpretation. New York, John Wiley & Sons in EASTMAN 1997 p.90

- les lettres minuscules représentent les signatures spectrales* suivantes ;

u => urban

c=> corn (maïs)

s => sand (sable)

w => water

d => deciduous (feuillus)

- les points noirs sont les moyennes de chaque catégorie d'occupation du sol ;

- les chiffres 1 et 2 représentent 2 pixels à comparer.

- le pixel 1 est du maïs (c pour corn) ;

- le pixel 2 est de l'urbain (u pour urban).

 

4.1.2. Représentation en deux dimensions

j) Utiliser la fonction SCATTER depuis le menu Analysis/Image Processing/Signature Development.

- Choisir :

- File 1 (Y-axis) : H87TM3 (canal du rouge)

- File 2 (X-axis) : H87TM4 (canal du PIR)

- Laisser cocher par défaut : Natural log (ln) of pixels counts

- Sélectionner le nom du Signature group file : SIGS

- Donner un nom au fichier résultat : SCAT

valider par OK

- Zoomer sur la partie basse gauche de l'histogramme bidimensionnel*

- Lecture de l'histogramme bidimensionnel

- les couleurs brillantes indiquent les fortes concentrations de pixels (en log des fréquences)

- les couleurs sombres indiquent les faibles concentrations de pixels

- les rectangles indiquent l'extension de deux écarts-types de part et d'autre de la moyenne

- Pourquoi certains rectangles se chevauchent-ils ?

- mauvaise définition des classes

- mauvaise sélection des des zones d'entraînement

- mauvaise "date" de prise de vue

 

4.1.3. Classification par la méthode de la distance minimum

4.1.3.1. Classification par la méthode de la distance minimum brute

k) Vérifier que l'affichage automatique de la légende est coché dans le menu Display/Display Preference

- Lancer MINDIST depuis le menu Analysis/Image Processing/Hard Classifiers.

- Sélectionner :

- le Signature group file : SIGS

- le type de distance => Raw (sans standardisation par la moyenne et l'écart-type)

- la distance maximum de "collecte"=> Infinite

- Nommer l'image de sortie => RAW

Valider avec Continue ...

- Conserver tous les canaux d'enregistrement

- Quel est le thème dominant ?

 

4.1.3.2. Classification par la méthode de la distance minimum normalisée

- Il peut être intéressant de tenir compte de la dispersion des réflectances autour de la moyenne

On utilise alors la standardisation* (centrage par la moyenne, réduction par l'écart-type).

Un pixel est rattaché à une catégorie en fonction de sa valeur en nombre d'écart-type.

Si la distribution des pixels d'entraînement d'un thème donné est proche d'une distribution en cloche (C.f. figure 3), alors n'importe quel pixel de ce thème a :

- 67 p. 100 de chances d'appartenir à l'intervalle

moyenne des réflectances du groupe ± 1 écart-types

- 95 p. 100 de chances d'appartenir à l'intervalle

moyenne des réflectances du groupe ± 2 écart-types

- etc.

Pour en savoir plus sur les conditions d'application : C.f. la fiche mémo du cours d'enquête.

fig. 3 - Concentration des individus dans une distribution en cloche (normale)

Source BRION 1982, p.11

La répartition des individus est connue de part et d'autre de la moyenne* quelque soit la valeur de l'écart-type* .

Sur la figure 4, le pixel 2 n'est plus rattaché aux sables (sand) comme sur la figure 2 mais à l'urbain

Il est à :

- deux écarts-types de l'urbain

- trois écarts-types des sables

fig. 4 - Histogramme bidimensionnel et classification par la distance minimum standardisé


Source : LILLESAND et KIEFFER - 1979 - Remote Sensing and Image Interpretation. New York, John Wiley & Sons in EASTMAN 1997 p.91

l) Relancer MINDIST

- Modifier

- le type de distance => Normalized standard deviation (standardisation)

- Nommer l'image de sortie => MINSTD

- Comment décrire les effets de la distance standardisée (quels sont les thèmes qui progressent ?) ?

 

4.2. Classification par la méthode du maximum de vraisemblance

Cette méthode s'appuie sur une fonction de répartition probabiliste des réflectances dans les sites d'entraînement, répartition basée sur la statistique bayesienne.

fig. 5 - Histogramme bidimensionnel et classification par le maximum de vraisemblance


Source : LILLESAND et KIEFFER - 1979 - Remote Sensing and Image Interpretation. New York, John Wiley & Sons in EASTMAN 1997 p.92

m) Lancer MAXLIKE

- Indiquer le nom du Signature group file : SIGS

- Vérifiez le nombre de signatures dans la fenêtre de saisie

- Choisir de classer tous les pixels

Cocher Proportion to exclude => 0% (classify all pixels)

- Donner le même poids à chaque classe

Cocher Use equal prior probabilities for each signature => probabilité égale pour chaque classe

- Nommer l'image de sortie => MAX

Valider avec Continue ...

- Inscire un titre descriptif

- Quelle est la probabilité associée à chaque signature ?

Valider à nouveau avec Continue ...

- Retenir toutes les bandes

Valider avec OK

Le maximum de vraisemblance est la méthode :

- la plus lente,

mais si les sites d'entraînement sont bons

- c'est la plus précise

 

4.4. Classification par la méthode des hypercubes

Cette dernière méthode crée des "boîtes" utilisant :

- des unités d'écart-type (Z-score)

ou

- le minimum et le maximum

des valeurs de réflectances calculées sur les sites d'entraînement.

Si un pixel tombe dans les limites de la "boîte de signatures",

alors il est assigné à cette catégorie.

- C'est la méthode la plus rapide :

- l'option avec Min. et Max. permet un coup d'oeil global ;

- mais souvent la classification résultante est peu fiable.

C'est due à la corrélation* de l'information dans les bandes spectrales, qui donne des formes de cigares aux nuages de points (Cf. fig. 5).

Comme on le voit sur la figure 6, les boîtes prennent mal en compte ces allongements et de plus se chevauchent.

fig. 6 - Histogramme bidimensionnel et classification hypercubique


Source : LILLESAND et KIEFFER - 1979 - Remote Sensing and Image Interpretation. New York, John Wiley & Sons in EASTMAN 1997 p.93

n) Lancer PIPED

- Indiquer le nom du Signature group file : SIGS

- Vérifiez le nombre de signatures dans la fenêtre de saisie

- Choisir l'option Min/Max

- Inscire un titre descriptif

- Nommer l'image de sortie => PIPEDORIG

Valider avec Continue ...

- Retenir toutes les bandes

Valider avec OK

- À quoi correspondent les pixels en noir ?

Ce sont les pixels hors des "boîtes de signature"

o) La fonction EDITSIG permet de redéfinir le Min. et le Max. en éliminant les valeurs extrèmes.

L'option par défaut de PIPED utilise l'écart-type à la place du Min/Max pour atténuer l'effet des valeurs extrèmes.

p) Relancer PIPED

- Indiquer le nom du Signature group file : SIGS

- Vérifiez le nombre de signatures dans la fenêtre de saisie

- Choisir l'option Z-score

- À quoi correspondent la valeur 1,96 dans la fenêtre de saisie ?

- Inscire un titre descriptif

- Nommer l'image de sortie => PIPEDST

Valider avec Continue ...

- Retenir toutes les bandes

Valider avec OK

- En quoi l'utilisation de la valeur de l'écart-type à la place du Min/Max modifie-t-elle le résultat de la classification par hypercube ?

 

5. Comparaison des différentes méthodes de classification

q) Comparer chacune des classifications réalisées :

- MAX

- RAW

- MINDST

- PIPEORIG

- PIPEDST

- Utiliser :

- la palette Qualitative 256

- l'Expansion factor pour toutes les afficher en même temps

- La comparaison est-elle facile ?

Il existe des indices facilitant l'analyse, qui comparent le résultat de la classification avec :

- une carte existante (couverture exhaustive) ;

ou

- une enquête de terrain (information fragmentaire).

 

5.1. Préparation de la carte de référence

5.1.1. Visualisation de la carte de référence

- Afficher le fichier WORCWEST avec la palette WORCWEST

Avec la légende et le titre

- Sur quel secteur sommes-nous ?

Dans le NW de l'aéroport

- Avons-nous le même nombre de postes de légende ?

 

5.1.2. Extraction de la zone d'intérêt

- Afficher les informations sur les fichiers WORCWEST et H87TM1 (par exemple)

Avec File/Describe

- Quels sont les X et Y de l'un et de l'autre ?

- Qui est inclus dans qui ?

- Lancer Reformat/WINDOW

Puis :

- Laisser sélectionné par défaut Window only one image => seule WORCWEST sera redimensionnée

- Nommer l'image d'entrée => WORCWEST

- Nommer l'image de sortie => WORCWH87

- Recadrer sur une image déjà existante => H87TM1 (par exemple)

Constater que les X et Y de cette dernière s'affiche automatiquement

Min. X = 3 930

Max. X = 6 090

Min. Y = 1 020

Max. X = 3 600

Valider avec OK

 

5.1.3. Concaténation des classes

- Prendre la meilleure classification

à défaut, on prendra MINSTD

- Regrouper d'abord les deux classes d'eau qui ne sont pas séparées sur WORCWH87

Utiliser Analysis/Database Query/RECLASS

- Laisser par défaut :

Image comme Type of file to reclass

User-defined reclass comme Classification type

- Nommer l'image d'entrée => MINSTD

- Nommer l'image de sortie => CARTEODS

- Donner la valeur (Assigne a new value of) => 1

De la valeur (To all values from) => 2

Jusqu'à (To just less than) => 3

Cela revient à recoder l'ancienne classe 2 (Eau_prof) en 1 (E_peu_pr) qu'on appelera ensuite Eau.

- Puis incrémenter le curseur à l'aide des flèches de 1 à 2 pour modifier le reste des valeurs comme indiqué dans le tableau 1

tab. 1 - Modification de la légende de MINDSD dans RECLASS

Nouvelle valeur

De

à

Curseur

Ancienne classe

Nouvelle classe

1

2

3

1

E_peu_pr

Eau

2

5

6

2

Eau_prof

Feuillus

3

6

7

3

Culture

Résineux

4

3

4

4

Zon_urba

Cultures

5

4

5

5

Feuillus

Sols artificialisés

Valider avec OK

On va en profiter pour faire une palette cohérente avec la carte d'occupation des sols réalisée

- Lancer Display/Palette Workshop

Puis File/New

tab. 2 - Nouvelles couleurs pour les classes d'occupation du sol

Classe d'Occupation du sol

N° de classe

Valeur du Rouge

Valeur du Vert

Valeur du Bleu

Non classés

0

0

0

0

Eau

1

0

56

98

Feuillus

2

0

200

0

Résineux

3

0

150

0

Cultures

4

255

255

0

Sols artificialisés

5

255

0

0

Puis File/Save As ...

- Nommer le fichier palette => CARTE6CL (8 caractères maxi)

- Cocher le bouton radio de la sauvegarde dans la bibliothèque permanente (Save file in permanent library)

Valider avec OK

- Quitter puis appliquer la palette à CARTEODS

Composer/Properties

Palette file => CARTE6CL

Cocher Use legend

- À quoi ressemble les postes de légende ?

Les renseigner dans Document

- Lancer File/Document

- Laisser sélectionné par défaut Image file

- Fichier à renseigner => CARTEODS

Valider avec OK

- Cliquer sur Legend categories

- Remplir comme suit

tab. 3 - Modification de la légende de MINDSD dans RECLASS

Legend categories

Classe d'occupation du sol

0

Non classés

1

Eau

2

Feuillus

3

Résineux

4

Cultures

5

Sols artificialisés

Valider avec OK

- Recharger la légende

- Qu'en pensez-vous ?

- L'image WORCWH87 contient également trop de postes d'occupation du sol pour être comparée à notre classification

- Faire les regroupements comme précédemment

Utiliser Analysis/Database Query/RECLASS

- Laisser par défaut :

Image comme Type of file to reclass

User-defined reclass comme Classification type

- Nommer l'image d'entrée => WORCWH87

- Nommer l'image de sortie => WORCWREF

- Donner la valeur (Assigne a new value of) => 2

De la valeur (To all values from) => 3

Jusqu'à (To just less than) => 5

Cela revient à recoder les anciennes classes 2, 3 et 4 (Deciduous 1, 2 et 3) en 1 (Deciduous 1) qu'on appelera ensuite Feuillus.

- Puis incrémenter le curseur à l'aide des flèches de 1 à 2 pour modifier le reste des valeurs comme indiqué dans le tableau 4

tab. 4 - Modification de la légende de WORCWREF dans RECLASS

Nouvelle valeur

De

à

Curseur

Ancienne classe

Nouvelle classe

2

3

5

1

Deciduous 1, 2 et 3

Feuillus

3

5

7

2

Conifer 1 et 2

Résineux

4

8

9

3

Agriculture

Cultures

5

7

8

4

Grass/Suburb

Sols artificialisés

5

9

15

5

Urban à Baren

Sols artificialisés
Comme vous pouvez le constater, on n'a pas touché aux classes 0 (Non classés) et 1 (Eau) qui sont déjà cohérentes avec notre classification reclassée CARTEODS.

Valider avec OK

- Modifier le .doc de WORCWREF

Lancer File/Document

- Laisser sélectionné par défaut Image file

- Fichier à renseigner => WORCWREF

Valider avec OK

- Cliquer sur Legend categories

- Remplir comme au tableau 3

 

5.2. Comparaison à la carte de référence

- Afficher les fichiers images WORCWREF et CARTEODS côtes-à-côtes

- Lancer Analysis/Decision Support/ERRMAT

- Nommer l'image de vérité terrain* (Ground truth image) => WORCWREF

- Nommer la carte issue de la classification* (Categorical map image) => CARTEODS

- Quel est le thème qui a la plus forte erreur d'omission ?

- Quel est le thème qui a la plus forte erreur de comission ?

- La classification est-elle performante ?

La fiche mémo mem43tel.htm contient les informations nécessaires pour l'analyse des matrices d'erreur et des indices associés.

 

Conclusion :

- Quelle méthode de classification choisir ?

- Le minimum de distance :

- donne de bons résultats quand il est utilisé avec la distance standardisée ;

- est plus rapide que le maximum de vraisemblance ;

- est plus lent que la classification par hypercube ;

- supporte un faible nombre de pixels d'entraînement ;

- est assez tolérant vis-à-vis des problèmes de définition des parcelles d'entraînement.

- Le maximum de vraisemblance :

- produit des meilleurs résultats quand les sites d'entraînement sont très bons ;

- méthode la plus gourmande en temps de calcul.

- La méthode des hypercubes :

- peut donner de bons résultats avec l'option écart-type ;

- est la plus rapide.

 

Celle qui a la meilleure matrice de confusion globale ou pour le thème recherché !

 

Retour au début de la fiche Guide

 

Fiche Guide suivante

 

NB : les mots suivis de "*" font partie du vocabulaire géographique, donc leur définition doit être connue. Faites-vous un glossaire.