Comment tester l'intensité d'une liaison quantitative / quantitative ?
Hypothèse sur la normalité des variables quantitatives
- Les variables quantitatives ont une distribution proche de la normale
- tests paramétriques
- Les variables quantitatives ont une distribution non normale
- tests non paramétriques
En attendant que ce chapitre soit écrit, on peut consulter, pour se rafraîchir la mémoire, ce passage dans la mem43tel.htm relatif à la notion de corrélation entre canaux satellitaux.
Cette partie de la fiche guide est en : Un peu de patience !!!
- Quelles sont les conditions d'application des tests non paramétriques ?
Lorsque,
- il n'est pas possible d'émettre certaines hypothèses :
- normalité des distributions ;
- égalité des variances, ...
- la taille de l'échantillon devient trop faible (hypothèses précédentes invérifiables !).
Bien qu'il soit robuste, l'utilisation du coefficient de corrélation "r" de Bravais-Pearson n'est pas possible.
On utilise alors des tests non paramétriques
Le test du Khi2, vu à la fiche mémo 5.1, est un test non paramétrique.
Les méthodes non paramétriques peuvent traiter la totalité, ou presque, des relations entre variables quantitatives.
Le coefficient de remplacement le plus courant est le :
Coefficient de corrélation de rangs, ou de Spearman
Les données de base sont une série de m couples (ai ; bi).
Les a et b sont classés séparément, à chaque :
- a correspond un rang de 1 à m ;
- b correspond un rang de 1 à m ;
On va substituer à chaque a et b son rang et en faire la différence d qui vaut :
di = (rang ai - rang bi)
La formule de la différence de rangs, dite (lire rhô) de Spearman, est :
formule n°1 - (mem53nq.htm)
- Si le nombre de couples est assez grand :
m > ou = 10
On peut utiliser la table n°3 du coefficient "r" de Bravais-Pearson
pour m - 2 degrés de liberté (d.d.1.)
- Pour de plus petits effectifs, pour notre exemple, il faut recourir à la table n°6.
Exemple :
On a les notes de deux TP du cours d'enquête pour 10 étudiants. C'est l'équivalent du problème de la double correction pour 10 copies (air connu !).
Notes => TP1 TP2 . n°copie a rang a b rang b (diff de rang)^2 1 6,5 7 15,0 8 1 2 6,0 5 10,0 4 1 3 5,5 4 14,0 6 4 4 6,0 5 14,0 6 1 5 0,0 1 0,0 1 0 6 6,5 7 10,5 5 4 7 5,0 3 0,0 1 4 8 6,5 7 18,0 10 9 9 0,0 1 0,0 1 0 10 6,5 7 15,0 8 1 = 1 - (6 * 25) / 10 (100 - 1) = 0,848
- La liaison est-elle intense et significative ?
Comparer les deux tables
- Que faire en présence de nombreux ex-aequo ?
Au moins 2 possibilités :
- Attribution d'un rang commun aux ex-aequo ;
- Départage des ex-aequo par tirage au sort.
Ce fichier est au format Excel98 (.xls) et "pèse" 97 ko..
- Refaire sous Excel l'exemple des notes de TP
Onglet => tab2a
- Analyser les dégâts tempétueux pour deux forêts du massif de Conches-Breteuil (Eure)
Onglet => tab2b
Exemple tiré de : AMAT (J.-P.), GODARD (V.), HOTYAT (M.) - 2003 - Bilan des dégâts : Milieu, gestion, histoire et scénarios de reconstitution dans les sylvosystèmes touchés par les tempêtes de décembre 1999, GIP-ECOFOR, Min. agriculture, 133 p.
Communiquez-moi par courrier électronique les réponses aux questions suivantes Question n°5.3.1.
Question n°5.3.2.
|
NB : les mots suivis de "*" font partie du vocabulaire statistique, donc leur définition doit être connue. Faites-vous un glossaire.