Une parcelle de blé de 18ha en RGB

Lorsque l’on souhaite faire des mesures de variables biophysiques dans une parcelle, il faut remplir deux objectifs principaux: obtenir une représentativité géographique de la parcelle (on doit prendre des mesures sur toute l’emprise) et assurer une représentativité statistiques des pixels de la zone étudiée.

Un indice de végétation peut être utilisé pour caractériser les pixels de la parcelle, dans notre cas nous utiliserons le NDVI (Normalized Difference Vegetation Index), et une classification Kmeans est faite afin de mettre en évidence les zones homogènes de la parcelle à partir des images Sentinel2 du programme copernicus

Représentativité géographique

Un bon moyen d’aller prélever partout dans la parcelle est de la diviser en carrés limités par les bords de la parcelles, la taille des cellules va conditionner le nombre de points de prélèvements que l’on choisira comme le centroïd de chaque cellule.

Dans la parcelle ci dessus, si l’on choisit 5 cellules alors le programme va superposer une grille de (5*5) cellules sur la parcelle, puis limiter les cellules aux bordures de la parcelle.

Répartition des cellules de la grille sur la parcelle NDVI Kmeans

Sur l’image ci-dessus, on voit qu’il y a 6 classes de NDVI dans la parcelle, les surfaces de chaque classe sont indiquées dans le titre du graphique.

Les cercles rouges correspondent aux points de prélèvements. Il y en a ici une dizaine.

Représentativité statistique

Analyse fréquentielle des NDVI de la parcelle (2005 pixels de 10 mètres de coté)

L’objectif est donc de trouver le nombre de points GPS de prélèvements minimum qui caractérisera au mieux cette analyse fréquentielle. On doit donc respecter les critères moyenne, écart-type et distribution du nuage de point de la parcelle.

Pour ce faire on utilise le test de Kolmogorov-Smirnov qui mesure la distance maximum entre deux lois de répartition. Plus le résultat du test est petit plus la représentativité de l’échantillon est bonne.

On va donc, calibrer le nombre de cellules dans la parcelle de façon à avoir une qualité statistique inférieure à une valeur seuil, typiquement, on va partir d’un nombre de cellule bas, puis l’augmenter jusqu’à constater une dérivée de la fonction (Cellules/Résultat) proche de zéro, indiquant que le modèle ne s’améliore plus.

Evolution du résultat fonction de la racine carrée du nombre de cellules dans la parcelle
Plan de prélèvement avec 15*15 cellules

Sur l’image ci dessus on obtient donc un plan de prélèvements avec 108 points de mesures, la répartition géographique est évidemment parfaite avec la grille.

Fonction de répartition comparée des pixels (2005) et des points de mesure (108)

On constate que les deux jeux de données (pixels de la parcelle et points de prélèvements) se comportent de la même manière au vu de la fonction de répartition (fréquence cumulée fonction du niveau de NDVI)

La dernière étape consiste à exporter au format GPX les points de prélèvements pour aller faire les mesures dans la parcelle.

Comparaison avec une méthode aléatoire

Exemple de choix de 45 points aléatoires dans la parcelle
Fonction de répartition correspondante (Les points sont les mesures aléatoires et le trait continu les pixels du champ)
Axe des abscisses Nombre de points de prélèvement/ Ordonnées: Résultat du test de Kolmogorov

On constate sur le graphe ci-dessus, qu’au même nombres de point GPS la méthode de la grille donne un meilleur résultat que la méthode aléatoire au vu des deux régressions.