TD 2.1 - Prise en main et jeux avec les projections.

Vincent GODARD - V1.1 - 13/02/2022

Cours de traitement des données et cartographie

Département de géographie - L2 - Université de Paris 8


Notebook destiné à être exécuté sur le net dans JupyterLab ou Kaggle par exemple.


Pour en savoir plus sur Python, par exemple : https://fabienmaussion.info/scientific_programming/week_05/02-Scientific-Python.html

Ce premier TD doit beaucoup à :

https://towardsdatascience.com/master-geographic-data-science-with-real-world-projects-exercises-96ac1ad14e63

Mais il est également inspiré de

(à venir)

et de

(à venir)
 

Téléchargement des documents nécessaires :

Dossier compressé à télécharger => ici.


1. Indiquer le chemin d'accès aux données

Lecture des données géographiques (des vecteurs) dans différents formats comme les Shapefiles, Geopackage ou les Geojson. La plupart des géodonnées sont lisibles avec le paquet de programmes (package) Geopandas. Paquet que vous stockerez dans votre bibliothèque (Library). On utilisera ici le programme de ce paquet appelé ".read_file()".

Faisons un premier essai.

On obtient un message d'erreur ! Pourquoi ? Il existe des paquets préchargés (cf. infra Matplotlib) et d'autres, non !

2. Chargement des paquets (packages)

Après l'import d'un paquet, avant de le charger, de l'exécuter, il faut souvent redémarer le noyau du JupyterLab (Restart the kernel).

3. Lire les données géographiques

3.1 Lecture des données "pays" (country)

Normalement, il ne se passe rien ! Elles ont été lues, mais on n'a pas choisi de les afficher, par exemple !


3.2 Affichage des 5 premières lignes

Pourriez-vous décrire les différentes :


3.3 Affichage du nombre de lignes et colonnes du tableau


3.4 Édition de quelques statistiques

Qu'est-ce qu'on a comme indicateurs statistiques (en lignes) ? Sont-ils adaptés à toutes les variables (en colonnes) ?


3.4 Lecture des données sur les villes (Cities)

On peut comme précédemment regarder les 5 premières lignes du tableau de données. Regarder sa taille. Éditer quelques statistiques de base.

Que peut-on dire de ce tableau ? Quelle est la signification de la première colonne ? De quelles coordonnées s'agit-il ? Que nous apprend le champ "geometry" ? Dans quel(s) pays sommes-nous ?

Que peut-on dire de ces villes ?


4. Cartographie des couches chargées

La cartographie des deux jeux de données (couches) countries et cities va nous faire utiliser la fonction ".plot()". Nous allons superposer ces deux jeux de données.

Pourquoi l'excécution de ce script nous renvoie-t-elle un message d'erreur ?

Il faut, là encore, lire spécifiquement la dernière ligne de ce message "NameError: name 'plt' is not defined". => nous n'avons pas défini (importer donc) la fonction "plt" !


5. Petit exercice en autonomie

Pourriez-vous :

1) lire les données rivers.gpkg ?

2) lire les 5 premières lignes du jeu de données (dataset) rivers ?

3) afficher le jeu de données (dataset) rivers ?


6. Systèmes de coordonnées et projections