Graphab 2.8 Manuel d'utilisation Céline Clauzel, Jean-Christophe Foltête, Xavier Girardet, Gilles Vuidel 11/05/2022 Table des matières 1 Introduction 2 2 Démarrer un projet Graphab 3 3 Graphes 7 4 Corridors 5 Capacité des taches 10 11 1.1 A propos de Graphab . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Conguration requise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Installation et lancement du programme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1 Identication du projet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Importation de la carte du paysage et dénition des n÷uds . . . . . . . . . . . . . . . . . . . 2.3 Création d'un jeu de liens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1 Création d'un graphe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Partitionnement de graphe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1 Capacité calculée comme une fonction du voisinage . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Capacité dénie à partir de données externes . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3 Suppression de taches . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 Calcul des métriques de connectivité 6.1 6.2 6.3 6.4 Famille de métriques et niveaux de calcul Paramétrage des métriques pondérées . . Calcul des métriques par lot . . . . . . . . Interpolation des métriques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.1 9.2 9.3 9.4 Import de données ponctuelles . Matrices de distance inter-points Générer des points aléatoires . . Modèle de distribution d'espèce . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Ajout de taches 8 Méta-taches 9 Liens entre graphes et données ponctuelles 10 Achage . . . . . . . . . . . . . . . . . . . . 10.1 Propriétés des graphes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.2 Propriétés des objets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Capacités de traitement et limitations 12 Métriques 12.1 Métriques pondérées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.2 Métriques de surface . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.3 Métriques topologiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 2 2 2 3 3 5 7 8 11 12 12 13 13 15 16 18 19 21 21 21 22 23 24 26 26 27 28 29 30 34 35 1 Introduction 1.1 A propos de Graphab Le programme Graphab est un outil de modélisation des réseaux écologiques fondé sur les graphes paysagers. C'est un outil intégré composé de 4 modules : création de graphes à partir d'une carte de paysage avec identication des taches d'habitat et des liens (distance euclidienne ou chemin de moindre coût) calcul d'un grand nombre de métriques de connectivité intégration des métriques de connectivité dans un modèle de distribution d'espèce interface de géo-visualisation Attention, les projets ne sont pas compatibles entre les versions 1.x et 2.x de Graphab ! 1.1.1 Auteurs Le programme Graphab a été développé par Gilles Vuidel et Jean-Christophe Foltête au laboratoire ThéMA (Université de Franche-Comté CNRS). Le développement du logiciel a été nancé par le ministère de l'écologie, du développement durable, des transports et du logement dans le cadre du programme ITTECOP. Le logo de Graphab a été conçu par Gachwell. 1.1.2 Conditions d'utilisation Le programme Graphab est disponible librement sous licence GPL. Les utilisateurs de Graphab sont invités à citer une des références suivantes [Foltête et al.(2012a), Foltête et al.(2021)] dans leurs travaux : Foltête J.-C., Vuidel G., Savary P., Clauzel C., Sahraoui Y., Girardet X., Bourgeois M. 2021. Graphab : an application for modeling and managing ecological habitat networks. Software Impacts.8 : 100065. Foltête J.C., Clauzel C., Vuidel G., 2012. A software tool dedicated to the modelling of landscape networks. Environmental Modelling & Software, 38 : 316-327. 1.2 Conguration requise Graphab fonctionne sur tout ordinateur supportant Java 8 ou supérieur (PC sous Linux, Windows, Mac...). Toutefois, lorsqu'il s'agit de données très volumineuses, la quantité de mémoire vive (RAM) de l'ordinateur peut limiter le nombre maximum de n÷uds et de liens qui peuvent être traités en une seule fois avec Graphab. De plus, pour certaines métriques complexes, la puissance de votre processeur va déterminer la vitesse de leur calcul. Vous trouverez plus de détails à ce sujet dans la section 11 et dans [Foltête et al.(2012a)]. 1.3 Installation et lancement du programme Graphab est téléchargeable à cette adresse : https://sourcesup.renater.fr/www/graphab. Télécharger et installer Java 8 ou + (adoptium.net). Installer de préférence la version 64 bits de Java. Télécharger graphab-2.8.jar Lancer graphab-2.8.jar Une fois graphab-2.8.jar lancé, le menu chier donne accès à 4 rubriques : Fichier / Nouveau projet : pour commencer la création d'un projet dans lequel toutes les données et résultats sont automatiquement enregistrés. Fichier / Ouvrir un projet : ouvre un projet déjà créé auparavant. Fichier / Préférences : pour changer certains paramètres du programme : langue anglais/français ; quantité maximale de mémoire utilisable ; nombre de processeurs à utiliser. Il est recommandé d'adapter la quantité de mémoire et le nombre de processeurs aux capacités de l'ordinateur utilisé et aux traitements prévus (voir à ce sujet la section Capacités de traitement et limitations). Fichier / Journal : ache le journal des évènements. 2 2 Démarrer un projet Graphab La mise en place d'un nouveau projet Graphab s'eectue à partir du menu : Fichier / Nouveau projet. L'utilisateur doit renseigner plusieurs fenêtres successives : identication du projet, importation de la carte paysagère, création d'un jeu de liens. Un projet correspond à l'exploitation d'une seule carte paysagère initiale, mais il peut comporter plusieurs jeux de liens. Au terme de la phase de démarrage, le projet sera le support pour la création de multiples graphes et calculs de métriques de connectivité. 2.1 Identication du projet Dans la première fenêtre, l'utilisateur doit nommer le projet et indiquer dans quel dossier celui-ci sera créé. 2.2 Importation de la carte du paysage et dénition des n÷uds La deuxième fenêtre concerne l'importation de la carte du paysage. Celle-ci doit être un chier de type raster, au format Ti (*.tif), AsciiGrid (*.asc) ou Idrisi (*.rst), dans lequel la valeur de chaque pixel correspond à une catégorie (occupation du sol ou autre type de classication). 3 S'il est en format *.tif, sans extension Geoti, le chier doit être associé à un chier de géoréférencement (*.tfw) structuré comme suit : Exemple 10.0 0.0 0.0 -10.0 821755.0 2342995.0 Taille du pixel en X Rotation sur les lignes (0 pour les bonnes images) Rotation sur les colonnes (0 pour les bonnes images) Taille du pixel en Y Coordonnée en X du pixel haut gauche Coordonnée en Y du pixel haut gauche S'il est en format *.rst, le chier doit être associé à un chier de géoréférencement (*.rdc) suivant la structure proposée dans le logiciel Idrisi. Important! L'unité du système de coordonnées de l'image doit être en mètre. Si ce n'est pas le cas, les unités de surface et de distance seront erronées. Il est possible de reprojeter l'image dans une projection métrique (Lambert93, UTM, . . .) à l'aide d'un SIG. Code hors zone : code des pixels correspondant à l'absence de valeurs dans le chier raster. Code de l'habitat : valeurs des pixels correspondant à l'habitat utilisé pour la dénition des taches. Plusieurs valeurs peuvent être sélectionnées en maintenant la touche Ctrl. 4 Taille min. de l'habitat : surface minimale en hectare pour qu'une tache d'habitat devienne un n÷ud du graphe. Connexité des taches : 4-connexité : une tache est constituée du pixel central et de ses 4 voisins s'ils ont la même valeur ; 8-connexité : une tache est constituée du pixel central et de ses 8 voisins s'ils ont la même valeur. 2.3 Création d'un jeu de liens La troisième fenêtre concerne la création d'un jeu de liens, ce qui implique la sélection de plusieurs paramètres : topologie et pondération des liens. La création de ce jeu de liens constitue la dernière étape dans la mise en place initiale du projet. Cependant, il est possible de créer à tout moment de nouveaux jeux de liens dans le même projet, par le menu : Graphes / Créer un jeu de liens. 2.3.1 Topologie des liens Deux topologies sont disponibles : planaire : seuls les liens formant un graphe planaire minimal sont pris en compte. Cette topologie est mise en place par l'intermédiaire de polygones de Voronoï autour de chaque tache d'habitat. Ces polygones sont dénis à partir des bords des taches, en distance euclidienne. complet : tous les liens entre les taches sont potentiellement pris en compte. Distance max : Cette option permet de préciser un seuil de distance au-delà duquel les liens ne sont plus créés. Elle permet ainsi de limiter le nombre de liens créés et d'accélérer la création des liens. L'unité de la distance dépend du type de distance : en mètre pour la distance euclidienne et en coût pour la distance de moindre coût. 5 Supprimer les liens traversant les taches : cette option, décochée par défaut, permet de ne pas créer de lien entre deux taches (A et C sur la gure suivante) passant par une tache intermédiaire (B). Ceci est recommandé pour le calcul de la métrique de centralité intermédiaire (BC) pour prendre en compte la fréquence avec laquelle chaque tache se trouve sur les plus courts chemins liant les paires de n÷uds sur le graphe. A noter : cette option fournit une approximation de la distance intra-taches entre A et C. Si la case est décochée, un lien entre A et C passant par B sera créé et représentera la distance complète réelle entre les deux taches. Figure 1 Illustration de l'option Supprimer les liens traversant les taches Enregistrer les chemins : si la case est cochée : les liens sont enregistrés sous forme de chemins représentant le tracé réel du lien entre deux taches. si la case est décochée : les liens sont enregistrés sous forme topologique uniquement. Dans ce cas, la visualisation des liens en vue réaliste n'est plus possible. Ceci est recommandé lorsque le graphe contient de nombreux liens (dans le cas d'un graphe complet non seuillé par exemple) an de limiter l'utilisation de la mémoire. A noter : si les chemins ne sont pas enregistrés, il n'est pas possible d'inclure les distances intra-taches dans le calcul des métriques. 2.3.2 Distance (ou impédance des liens) Les distances sont calculées de bord à bord entre les taches. Deux principaux types de distance sont possibles : distance euclidienne et distance de moindre coût. Distance euclidienne : les liens sont calculés en distance euclidienne (parcours à vol d'oiseau entre les taches), ce qui revient à considérer la matrice comme uniforme. Distance de moindre coût : les liens sont calculés en distance coût. Cette distance correspond à la somme des coûts de tous les pixels du chemin parcouru. L'hétérogénéité de la matrice est prise en compte en assignant des valeurs de coût (ou résistance) aux classes paysagères. L'utilisateur peut activer cette possibilité de deux façons : 1. soit en indiquant les coûts correspondant aux catégories de la carte du paysage dans le tableau ; 2. soit à partir d'un chier raster externe (format *.tif, *.asc ou *.rst) contenant pour chaque pixel une valeur de résistance. Pour chaque lien créé, sa longueur métrique (DistM) et sa distance en unité de coût (Dist) sont enregistrées et consultables dans les propriétés (cf. Propriétés des objets). Les valeurs de résistance dénies précédemment peuvent être modiées en fonction de la pente [Clauzel et al.(2015b)]. Pour que la pente puisse être calculée, il faut tout d'abord charger un MNT à partir du menu Données | Importer un MNT. Le paramètre coef (c) permet d'ajuster l'importance de la pondération par la pente (p). Pour un pixel donné, la résistance résultante (rf inal ) est calculée comme suit : rf inal = r ∗ (1 + c.p) avec p = hl la pente exprimée par le rapport hauteur(h) sur longueur (l). p = 0 pour une pente nulle et p = 1 pour une pente de 100% (h = l). 6 Pour c = 1 la valeur de résistance est doublée avec une pente de 100%. Pour c = 10 la valeur de résistance est doublée avec une pente de 10%. 3 Graphes 3.1 Création d'un graphe Un projet Graphab peut donner lieu à la création de plusieurs graphes. Chaque graphe étant construit à partir d'un jeu de lien, soit on utilise le jeu de lien déni lors de la mise en place initiale du projet, soit on dénit un nouveau jeu de lien par le menu : Graphes / Créer un jeu de liens. La création d'un graphe s'eectue par le menu : Graphe / Créer un graphe. Le graphe à créer doit tout d'abord être nommé. L'utilisateur doit ensuite sélectionner un des jeux de liens créés précédemment (cf. Création d'un jeu de liens), puis choisir un type d'élagage du graphe : Aucun : tous les liens sont créés entre les taches quelle que soit leur distance. Distance maximale : les liens retenus sont inférieurs ou égaux à la distance choisie. Arbre couvrant minimal : graphe reliant toutes les taches dont le poids total des liens est minimal. Option Inclure les distances intra-taches : si la case est cochée, le calcul des métriques à l'étape 3 tient compte des distances intra-taches (recommandé) ; dans le cas contraire, seules les distances inter-taches sont prises en compte. Pour un graphe élagué par une distance maximale, l'unité de cette distance dépend du type de distance utilisé dans la création du jeu de liens. Si le jeu de lien a été créé en distance euclidienne, la distance maximale est exprimée en mètres. Si la création du jeu de lien a été réalisée en distance-coût et que l'impédance est en coût cumulé, la distance maximale est exprimée en coûts cumulés. L'unité (mètre ou coût) du jeu de liens sélectionné est rappelé à côté du champ "Distance maximale". Il est possible d'obtenir une approximation de la distance métrique (appelée DistM) exprimée en coûts cumulés (appelée Dist) en représentant tous les liens inclus dans le jeu de liens dans un nuage de points double logarithmique, et en utilisant l'équation ci-dessous pour eectuer cette conversion : Dist = eintercept+slope.log(DistM ) 7 L'estimation peut être réalisée directement dans le logiciel à partir du menu Conversion distance présent dans le menu contextuel d'un jeu de lien (clic droit sur le jeu de lien). Le paramètre "Ignorer les chemins avec un coût supérieur à" permet d'exclure de la régression les chemins traversant des pixels avec des coûts supérieurs ou égaux à la valeur renseignée. Cette option est utile pour exclure de la conversion de distance les liens traversant des éléments barrière ou quasi infranchissable. Ce paramètre ne fonctionne pas pour des jeux de liens ayant un raster de coût externe. Pour réaliser une analyse multiscalaire, il est souvent nécessaire de créer une série de graphes élagués dont la distance maximale est dénie de façon croissante. L'utilisateur peut créer manuellement cette série de graphes, mais si l'objectif est d'analyser le comportement d'une métrique de connectivité en fonction de la distance maximale, il est préférable d'utiliser le menu : Métriques / Graphes par lot (cf. 6.3.1). 3.2 Partitionnement de graphe Graphab implémente un algorithme de partitionnement de graphe qui maximise l'indice de modularité [Newman(2006)]. La modularité est une mesure de la qualité d'un partitionnement des noeuds d'un graphe. Le principe sous-jacent est qu'un bon partitionnement d'un graphe implique un nombre de liens à l'intérieur des groupes important et un nombre de liens inter-groupes faible. Le calcul utilisé est basé sur l'algorithme glouton, suivi d'une optimisation locale [Brandes et al.(2008)]. 8 La modularité est calculée à partir d'un poids (wij ) déni pour chaque lien du graphe : wij = (ai aj )β e−αdij Les 2 paramètres β et α permettent de dénir respectivement l'importance de la capacité des taches (ai aj ) et l'importance de la distance (dij ) pour le poids du lien wij . Si α = β = 0 alors les poids sont tous identiques : wij = 1. Le partitionnement est accessible depuis le menu contextuel d'un graphe (clic droit sur le nom d'un graphe). La première fenêtre demande de renseigner les paramètres α et β . Le paramètre α n'est pas renseigné directement, il est déterminé à partir de deux autres paramètres : une distance d et une probabilité p (cf. Paramétrage des métriques pondérées). Pour dénir α à 0, il faut mettre p à 1. La partie droite de la fenêtre permet de choisir quel(s) partitionnement(s) conservés. Par défaut tous les partitionnements calculés sont conservés en mémoire pour pouvoir les acher par la suite. Ce paramétrage est utile pour éviter la saturation de la mémoire dans le cas de gros graphes (supérieur à 5000 noeuds). Dans ce cas, on peut conserver uniquement le meilleur ou bien donner un intervalle de tailles de partitions à conserver compris entre 1 et le nombre de noeuds du graphe. Après validation de cette fenêtre, le calcul se lance jusqu'à obtenir un partitionnement maximisant la modularité. Le résultat s'ache sur une nouvelle couche du graphe. Deux autres fenêtres viennent compléter ce résultat. 9 La nouvelle couche montre les groupes de la partition sous forme de polygones. Comme un groupe correspond à un ensemble de taches, il est représenté par un polygone agrégeant les polygones de Voronoï des taches aectées à celui-ci. La couleur d'un groupe correspond à sa valeur de modularité ; la modularité totale est la somme des modularités de tous les groupes. Une première fenêtre contient un graphique montrant l'évolution de la modularité en fonction du nombre de groupes (clusters). Dans la gure précédente, on voit que la modularité maximale est atteinte pour un nombre groupes relativement faible. Il est possible de zoomer dans ce graphique pour visualiser plus précisément le pic de modularité. La deuxième fenêtre ache le nombre de groupes (Nb agrégats) maximisant la modularité ainsi que la valeur de modularité. Plusieurs fonctionnalités sont disponibles sur cette fenêtre : - le nombre de groupes peut être modié pour visualiser des partitionnements sous optimaux. Le résultat peut être visualisé en cliquant sur le bouton "Acher". Une nouvelle couche de partitionnement est ajoutée au graphe. - le bouton "Graphe" permet de créer un nouveau graphe ne contenant que les liens intra-groupes. - la case à cocher "Optimisation" réalise une optimisation locale du partitionnement après l'algorithme glouton ce qui permet d'améliorer sensiblement la valeur de modularité. Cette option est active par défaut. 4 Corridors Graphab permet de calculer les corridors représentant, pour une distance maximale donnée dmax , l'espace qui peut être traversé entre 2 taches d'habitat, ie. l'espace qui représente l'ensemble des chemins possibles reliant 2 taches et ayant une distance inférieure à la distance dmax . Les corridors peuvent être calculés uniquement à partir d'un jeu de liens qui a été déni à partir de coûts. Pour utiliser cette fonctionnalité, il sut de faire un clic droit sur un jeu de liens et cliquer sur "Corridor". La distance coût maximale dmax doit être renseignée avant de lancer le calcul. 10 Le résultat s'ache dans une nouvelle couche vectorielle ou raster selon le choix eectué. En vectoriel, la couche contient pour chaque lien du jeu de liens sélectionné un polygone représentant son corridor. Les liens ayant une distance supérieure à dmax n'auront pas de corridor. En raster, chaque pixel de la couche contient le nombre de corridors passant par celui-ci. Le résultat est automatiquement enregistré dans le répertoire du projet. En vectoriel, l'achage par défaut utilise la transparence pour faire apparaître les superpositions de corridors. 5 Capacité des taches La capacité d'une tache traduit sa qualité intrinsèque , considérée comme un indicateur de son potentiel démographique. Ainsi une tache avec une forte capacité pourra accueillir une forte population et inversement. La capacité intervient directement dans le calcul de certaines métriques de connectivité de surface et pondérées (voir la section 5). Par défaut (lors de la création initiale du projet), la capacité d'une tache est égale à sa supercie en m2. Cependant, il est possible de remplacer la supercie par n'importe quel autre indicateur de qualité. En eet, dans certains cas, la présence d'une espèce n'est pas liée à la supercie de la tache mais à la supercie d'autres types d'occupation du sol autour de la tache. Par exemple la présence d'amphibiens dans un étang de reproduction ne dépend souvent pas de la taille du plan d'eau mais de la supercie de l'habitat terrestre autour de ce plan d'eau. Avec le menu Données / Dénir la capacité des taches, il est possible de modier la capacité de l'ensemble des taches du projet par deux méthodes. 5.1 Capacité calculée comme une fonction du voisinage La première méthode consiste à dénir la capacité des taches comme une fonction de la composition de leur voisinage et de procéder à ce calcul directement dans Graphab. L'utilisateur doit sélectionner plusieurs critères : type de distance, distance maximale, catégories paysagères. Coûts : il s'agit de la métrique spatiale (euclidienne ou ensemble de coûts) correspondant à un des jeux de liens disponibles dans le projet. Il est à noter que l'usage des coûts dans cette procédure revient à dénir un 11 voisinage anisotropique autour des taches, ce qui peut diérer fortement d'une fonction de type buer dans un SIG. Pour des raisons de cohérence, il est conseillé d'utiliser le même type de distance que celui qui a permis de dénir les liens du graphe. Dans le cas d'un jeu de lien créé avec une distance euclidienne, il faut choisir all cost = 1 . Coût max. : comme pour la distance d'élagage du graphe, l'unité de cette distance maximale de voisinage dépend du type de distance utilisé dans la création du jeu de liens (euclidien ou distance-coût). Codes inclus : l'utilisateur peut choisir une ou plusieurs catégories paysagères, autre que la catégorie habitat , à prendre en compte dans le calcul de la capacité. L'option pondération par la distance permet d'introduire une pondération en fonction de l'éloignement à la tache, par le biais d'une fonction exponentielle négative. De cette façon, les surfaces sélectionnées compteront plus si elles sont proches de la tache et inversement. Les valeurs de capacité ainsi calculées remplacent les surfaces des taches pour tous les calculs qui suivront, mais il est possible de revenir à l'état initial par le menu : Données / Dénir la capacité des taches et en cochant l'option Surface de la tache. 5.2 Capacité dénie à partir de données externes L'autre possibilité est d'ouvrir un tableau de données au format *.csv, décrivant toutes les taches du projet et contenant comme attribut les valeurs de capacité dénies au préalable par l'utilisateur. Les identiants du tableau importé doivent être ceux qui ont été dénis lors de la création initiale du projet. Comme pour l'option précédente, les valeurs de capacité du tableau importé remplacent les surfaces des taches pour tous les calculs qui suivront cette importation, mais il est possible de revenir à l'état initial en cochant l'option Surface de la tache. 5.3 Suppression de taches Après avoir déni une capacité diérente de la surface de la tache, il peut être intéressant de supprimer les taches dont la capacité est considérée comme trop faible pour correspondre aux besoins l'espèce étudiée. L'entrée "Supprimer des taches" du menu Données, permet de créer un nouveau projet identique au projet actuel en supprimant les taches ayant une capacité inférieure à un seuil donné. 12 Après avoir renseigné la capacité minimale voulue, un nouveau projet est créé dans un sous répertoire du projet actuel et chargé à la n du traitement. 6 Calcul des métriques de connectivité 6.1 Famille de métriques et niveaux de calcul Chaque graphe créé dans un projet peut être utilisé pour calculer diérentes métriques de connectivité, dont le détail de calcul et les références bibliographiques sont mentionnés en annexe. Ces calculs s'eectuent à plusieurs niveaux correspondant aux grandes entrées du menu Métriques (tableau 1) : Métriques /Métrique globale : les métriques caractérisent le graphe entier. Métriques / Métrique par composante : les métriques caractérisent la connectivité interne de chaque composante (ou sous-graphe). Métriques / Métrique locale : les métriques caractérisent la connectivité de chaque élément du graphe, n÷ud ou lien. Métriques / Delta-métriques : les métriques caractérisent également chaque élément du graphe, mais à partir d'un mode de calcul spécique. En utilisant la méthode dite de la suppression (suppression de n÷ud ou suppression de lien), l'importance relative de chaque élément du graphe est évaluée en calculant le taux de variation que sa suppression occasionne sur une métrique globale. Le résultat d'une delta-métrique est donc local, mais en référence au niveau global. Dans la fenêtre de dialogue qui s'ouvre suite au choix d'un de ces quatre modes de calcul, trois familles de métriques sont disponibles : les métriques pondérées, qui sont fondées sur des critères de distance et de capacité des taches et qui nécessitent un paramétrage adapté à l'espèce de référence. Ces métriques nécessitent des calculs de chemin sur les graphes, par le biais de l'algorithme de Dijkstra. En choisissant ces métriques, l'utilisateur doit indiquer le réglage souhaité. les métriques de surface, qui sont fondées en priorité sur un critère de surface. Dans le cas où la capacité ne correspond pas à la surface des taches mais à un autre critère, ces métriques peuvent être calculées et elles s'expriment dans l'unité du critère considéré. les métriques topologiques, qui sont issues de la théorie des graphes et qui ne nécessitent pas de paramétrage. 13 Famille Métrique de connectivité Code Métriques pondérées Flux Connectivité équivalente Probabilité de Connectivité Flux d'interaction (remplace FPC) Fractions de delta Probabilité de Connectivité Indice de centralité intermédiaire Indice Intégral de Connectivité Flux circuit Métriques de surface Taille moyenne des composantes Taille de la plus grande composante Probabilité de coïncidence de classe Taille de composante attendue Métriques topologiques Degré du noeud Coecient de groupement Centralité de proximité Excentricité Corrélation de connectivité Nombre de composantes Diamètre Indice d'Harary Lambda de Wilks F EC PC IF dPC BC IIC CF MSC SLC CCP ECS Dg CC CCe Ec CCor NC GD H W Niveau de calcul Delta métriques Global Comp. Local Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Table 1 Liste des métriques de connectivité et de leur niveau de calcul. Les codes sont indiqués suivant le nom anglais des métriques. Quel que soit le niveau choisi, l'utilisateur doit d'abord indiquer le graphe sur lequel le calcul va s'appliquer, puis choisir la métrique de connectivité. 14 Ö Ö Ö Ö 6.2 Paramétrage des métriques pondérées 6.2.1 Paramètre alpha Plusieurs métriques intègrent dans leur calcul une pondération où les distances entre les taches sont converties en probabilité de déplacement. Ces métriques sont : F, IF, PC, EC, BC... La pondération est basée sur une fonction exponentielle de la forme : p = e−αd où p est la probabilité de déplacement entre deux taches, d la distance entre ces taches et α un paramètre contrôlant la vitesse avec laquelle la probabilité diminue quand la distance augmente. Comme la valeur du paramètre α n'est pas facile à déterminer, le logiciel propose de le calculer à partir des deux autres paramètres. L'utilisateur doit indiquer la distance correspondant à une certaine valeur de probabilité, par exemple : la distance de dispersion maximale de l'espèce correspondant à une faible valeur de p (0.05 ou 0.01). la distance de dispersion moyenne de l'espèce correspondant à une valeur médiane de p (0. 5). La valeur α est automatiquement obtenue à partir de la formule : α = − log (p) /d 6.2.2 Paramètre bêta Certaines de ces métriques F, IF, BC sont aussi contrôlées par le paramètre β . Ce paramètre est l'exposant appliqué à la capacité des taches. Il joue sur l'équilibre relatif entre le poids des distances et le poids des capacités des taches dans la pondération des métriques. En prenant l'exemple de la métrique F en calcul local, dont la forme générique est la suivante : F = X aβ e−αd - une valeur de β = 0 signie que la capacité des taches ne joue pas de rôle dans la pondération. - une valeur de β = 1 signie que la capacité des taches joue de façon linéaire dans cette pondération. - une valeur de β = 2 signie que la capacité des taches est portée à la puissance 2. - une valeur de β = 0.5 signie que la racine carrée de la capacité des taches intervient dans la pondération. - une valeur de β = −1 signie que la capacité des taches joue de façon inversement proportionnelle. Au-delà de ces quelques exemples, toutes les valeurs de pondération sont possibles. 15 6.3 Calcul des métriques par lot Chaque métrique compatible avec le niveau global peut être calculée en chaîne suivant la variation de l'échelle des distances. Cette variation peut concerner soit l'élagage du graphe (6.3.1), soit le paramétrage des métriques elles-mêmes (6.3.2). Le type de distance considéré pour l'élagage est celui qui a été déni pour le jeu de lien choisi, à savoir distance euclidienne, distance de moindre coût, chemin de moindre coût. 6.3.1 Graphes par lot Le menu Métriques / Graphes par lot permet de créer une série de graphes élagués à partir d'un jeu de liens donné, et de calculer pour chacun une métrique de niveau global. Les distances maximales des graphes successifs sont dénis de façon croissante, suivant deux modes : distance : un intervalle de distance xe est déterminé entre les graphes successifs. Les valeurs de la métrique sont donc calculées à des intervalles réguliers de distance. nombre de liens : un nombre de liens xe est déni entre les graphes successifs. Ce nombre de liens est automatiquement transformé en distance utilisée pour élaguer le graphe. Ces distances peuvent s'échelonner de façon irrégulière. Les graphes sont dénis suivant trois critères donnés par l'utilisateur : minimum : plus petite distance, utilisée pour le premier graphe de la série. Par défaut, ce minimum est à 0, ce qui correspond à l'absence totale de liens. maximum : distance maximale, utilisé pour le dernier graphe de la série. Par défaut, ce maximum correspond à la distance maximale, ou le nombre de lien, du jeu de lien sélectionné. incrément : valeur de distance ajoutée à chaque nouveau graphe. Une fois le calcul terminé, le logiciel ouvre une nouvelle fenêtre dans laquelle la courbe de la métrique choisie est achée en fonction de la distance. Les valeurs de cette courbe peuvent être enregistrées par le bouton export, en sélectionnant le format texte. 6.3.2 Paramètres par lot Le menu Métriques / Paramètres par lot permet de calculer en série des métriques à partir d'un graphe donné. Cette possibilité s'applique exclusivement aux métriques pondérées. Elle se subdivise en deux entrées : métriques locales ou globales. Paramètres par lot pour métriques locales 16 Une métrique pondérée de niveau local est calculée en série suivant la variation d'un de ses paramètres. L'utilisateur doit choisir le graphe, la métrique et le paramètre à faire varier. La variation du calcul est déterminée par : min : valeur minimale du paramètre max : valeur maximale du paramètre incrément : valeur d'intervalle entre deux calculs de la métrique Une fois le calcul terminé, les taches (et dans certains cas les liens) du graphe sont caractérisées par une série de métriques supplémentaires. Paramètres par lot pour métriques globales Pour un graphe donné, une métrique pondérée de niveau global est calculée en série suivant la variation d'un de ses paramètres. Comme précédemment, cette variation est dénie entre une valeur minimale (min), une valeur maximale (max) et un intervalle (incrément). La procédure se termine par l'ouverture d'une nouvelle fenêtre dans laquelle la courbe de la métrique choisie est achée en fonction du paramètre. Le tableau 2 récapitule les possibilités de calcul des métriques. 17 Type Métriques pondérées Métrique de connectivité Code β Ö Ö Ö Ö Ö Ö Ö Paramètre par lot Ö Ö Ö Ö Ö Ö Ö MSC SLC Ö Ö CCP Ö Ö Ö Ö F Connectivité équivalente Probabilité de connectivité Flux d'interaction Fractions de delta Probabilité de connectivité Centralité intermédiaire Indice Intégral de Connectivité Flux circuit EC PC IF dPC BC IIC CF ECS Ö Ö Ö Ö Ö Ö α Graphe par lot Ö Ö Ö Ö Ö Ö Ö Ö Ö Flux Métriques de Taille moyenne des composantes surface Taille de la plus grande composante Probabilité de coïncidence de classe Taille de composante attendue Métriques Degré topologiques Coecient de groupement Centralité de proximité Excentricité Corrélation de connectivité Nombre de composantes Diamètre Indice d'Harary Lambda de Wilks Capacité des Distance Paramètres taches intra-taches Ö Ö Ö Ö Ö Dg CC CCe Ec CCor NC GD H W x x Ö Ö Ö Ö Ö Table 2 Possibilités de calcul des métriques de connectivité. 6.4 Interpolation des métriques Le menu "Analyses / Interpoler une métrique" permet de générer des couches raster à partir des métriques locales calculées au niveau des taches. Cette transformation est fondée sur une interpolation spatiale spécique, qui permet d'attribuer les valeurs de connectivité des taches à chaque cellule d'une grille, en utilisant une fonction de pondération décroissante à partir de la bordure des taches (poids de 1). Globalement, plus les cellules sont situées à l'écart du graphe, plus elles obtiennent des valeurs faibles de connectivité. 18 Ö Ö La pondération est une fonction exponentielle négative de la forme p = e−αd pour laquelle l'utilisateur doit choisir une distance (d) correspondant à une certaine probabilité (p) et le logiciel en déduit la valeur du paramètre α. En principe, ce réglage est à rendre cohérent avec le choix du graphe de référence ou le choix des éventuelles métriques pondérées qui sont à mobiliser, en utilisant la même valeur de d. L'option Connexion multiple permet de faire intervenir plusieurs taches dans le calcul des métriques au niveau des points. Le calcul est fondé sur une somme ou une moyenne pondérée des valeurs issues de toutes les taches comprises dans le voisinage des points, jusqu'à la Distance maximale indiquée. Il est à noter que la distance considérée dans ces calculs dépend du graphe de référence. Si celui-ci est fondé sur une distance de moindre coût, l'interpolation spatiale utilise cette même distance et non une simple distance euclidienne. L'interpolation des métriques est aussi utilisée automatiquement dans le calcul des modèles de distribution d'espèce (voir Modèle de distribution d'espèce). 7 Ajout de taches La fonction "Ajout de taches" est accessible à partir du menu Analyses. Elle permet de tester un ensemble d'emplacements pour créer de nouvelles taches d'habitat en fonction du gain de connectivité qu'elles procurent. Le logiciel calcule d'abord la métrique globale sélectionnée, puis ajoute virtuellement une tache et les liens entre cette tache et les taches existantes (seulement si leur distance est inférieure à la distance maximale du graphe dans le cas d'un graphe élagué) et recalcule la métrique globale. Une fois tous les emplacements testés, le logiciel valide l'emplacement qui procure le gain maximal de connectivité. La procédure est répétée jusqu'à l'ajout du nombre souhaité de nouvelles taches. 19 Plusieurs paramètres sont à dénir : Graphe : le graphe utilisé pour le calcul de la métrique de connectivité et l'ajout de nouvelles taches. Le graphe ne doit pas inclure les distances intra-taches et le jeu de lien sous-jacent doit être en topologie complète. Métrique : la métrique globale que l'on cherche à maximiser ainsi que son paramétrage (bouton Paramètres) NB taches : nombre de taches (qui deviendront de nouveaux n÷uds du graphe) que l'on souhaite ajouter. La dénition du jeu de taches à tester peut se faire de deux manières : En appliquant automatiquement une grille d'une certaine résolution (champs "taille de la cellule" à renseigner). Dans ce cas, le logiciel teste chaque centroïde de cellule en ajoutant virtuellement une nouvelle tache. Par défaut, tous les centroïdes ont une valeur de capacité identique (=1). Il est néanmoins possible d'importer une couche raster où chaque pixel de la matrice paysagère a une valeur de capacité propre. En important un shapele de points ou de polygones. Il faut dans ce cas indiquer la colonne de la table attributaire de ce shapele correspondant à la capacité des taches. Option "multi-taches" : cette option permet de tester l'ajout de plusieurs taches en simultané, pour être capable de reconnecter des taches séparées par une distance supérieure à 2 fois la distance de référence utilisée (dispersion maximale par exemple). Les taches supplémentaires sont recherchées dans une fenêtre de x cellules (paramètre à dénir) autour de la première tache. A la n du calcul, un répertoire nommé "addpatch_nX-GraphX_..." est créé et enregistré dans le répertoire du projet. Il contient : un shapele contenant les n÷uds ajoutés. La table attributaire indique l'étape à laquelle a été validé chacun des n÷uds et la valeur de la métrique globale correspondante. deux shapeles contenant l'ensemble des liens du graphe, y compris ceux reliant les nouveaux noeuds, en version topologique ("topo_links_graphXXX") ou en version réaliste "links_graphXX" un raster "landuse.tif" contenant l'occupation du sol modiée un répertoire "détail" contenant pour chaque étape le shapele des emplacements testés et la valeur de la métrique globale correspondant. Références : [Clauzel et al.(2015a), Foltête et al.(2014)] 20 8 Méta-taches À partir du menu Graphe, l'option "Créer un projet de méta-tache" permet de créer un nouveau projet où les noeuds du graphe correspondent à des ensembles de taches connectées à une certaine distance. Cette fonction permet de mieux prendre en compte l'emboîtement des échelles dans les processus écologiques et notamment le fait que la dénition fonctionnelle d'une tache d'habitat varie selon l'échelle considérée (Theobald, 2006 ; Zetterberg et al., 2010). Pour utiliser cette fonction, il est nécessaire de créer un projet initial et un graphe élagué à la distance souhaitée (par exemple à la distance quotidienne). Chaque composante de ce graphe élagué correspondra à une méta-tache. Celle-ci est donc constituée de l'ensemble des taches d'habitat connectées entre elles. La capacité des méta-taches est dénie par défaut comme la somme de la capacité des taches composant la méta-tache. L'autre option "Distance pondérée" permet de tenir compte de l'éloignement des taches entre elles. Pour cette option, il faut dénir le paramètre α en donnant une distance d et une probabilité p associée (cf. Paramétrage des métriques pondérées). La capacité résultante (C ) d'une méta-tache s'écrit : n C= n 1 X X −αdij cj e n i j L'option "capacité minimale" permet de ne garder pour le nouveau projet que les méta-taches qui ont une capacité supérieure ou égale au seuil déni. Le nouveau projet est enregistré dans un sous répertoire du projet initial et est chargé automatiquement à la n du traitement. Références : [Clauzel et al.(2015b)] 9 Liens entre graphes et données ponctuelles Le corps principal du logiciel est la mise en place des graphes et le calcul de métriques de connectivité, mais il est souvent très utile de relier ces éléments à des données externes. Le logiciel permet de faire interagir les données issues des graphes avec un jeu de données de points. 9.1 Import de données ponctuelles Des données ponctuelles peuvent être importées par le menu : Données / Importer des données ponctuelles. Ces données peuvent contenir plusieurs attributs, mais seuls les attributs binaires (présence/absence) seront 21 pris en compte dans certaines procédures (voir Modèles de distribution d'espèce au 6.3). Le chier importé peut être soit sous forme de couche vectorielle au format shapele (*.shp), soit sous forme de tableau (*.csv). Dans le second cas, il faut indiquer les colonnes du tableau qui correspondent aux identiants et aux coordonnées en X et en Y des points. Les attributs à prendre en compte doivent être sélectionnés à partir de la liste des attributs disponibles. Si les données ponctuelles ne contiennent pas d'attribut d'absence, elles ne peuvent pas être utilisées dans des modèles de distribution d'espèce. Si l'utilisateur envisage de mettre en place un modèle de distribution d'espèce, l'utilisateur doit créer un jeu de données de pseudo-absence avec Données / Générer des points aléatoires. 9.2 Matrices de distance inter-points Les données ponctuelles importées dans Graphab peuvent être à l'origine du calcul de matrices de distance inter-points par le menu Matrice de distance du menu contextuel d'un jeu de points (clic droit sur le nom d'un jeu de points). Cette fonction est par exemple utile pour comparer ces distances avec des distances génétiques entre les points. 22 Les distances peuvent être calculées de 2 manières : directement sur le raster ou bien à travers un graphe. 9.2.1 Distance raster En mode raster, les distances sont calculées en fonction d'un jeu de lien de référence. Ce jeu de lien ne peut pas être en distance euclidienne. Selon le jeu de lien choisi, il peut s'agir de la distance coût cumulée ou de la longueur du chemin de moindre coût. Dans les deux cas, le calcul intègre les coûts associés aux catégories de la carte de paysage, tels qu'ils ont été dénis dans le jeu de liens. Le résultat est une matrice de distance indépendante du graphe ; cette matrice correspond au calcul oert par les Systèmes d'Information Géographique. L'option Circuit permet de calculer la "distance de résistance" entre chaque point, c'est-à-dire la résistance équivalente d'un réseau de résistances électriques. Cette méthode permet de tenir compte de l'ensemble des chemins possibles et non pas uniquement le plus court (cf. [McRae et al.(2008)]). 9.2.2 Distance sur le graphe En mode graphe, les distances sont calculées en fonction du graphe sélectionné. Ce graphe doit être basé sur le jeu de lien utilisé à l'import du jeu de point. Simple : distance calculée suivant le plus court chemin sur le graphe de référence. Le type de distance correspond à celui qui a été utilisé pour la dénition du jeu de lien qui a servi à dénir le graphe de référence. Aux deux extrémités du chemin considéré, le calcul intègre la distance entre chaque point et la tache la plus proche. Suivant le choix qui a été fait au moment de la création du graphe, le calcul intègre éventuellement les distances intra-taches. Si les 2 points sont rattachés à la même tache, la distance calculée correspond au chemin de moindre coût sur le raster. Circuit : calcule la "distance de résistance" entre les taches les plus proches de chaque point. Le graphe est vu comme un réseau électrique où chaque lien du graphe représente une résistance. Cette option permet de tenir compte de l'ensemble des chemins possibles et non pas uniquement du plus court. 9.3 Générer des points aléatoires Le menu Données / Générer des points aléatoires permet de créer un ensemble de points de pseudo-absence en s'appuyant sur un ensemble de points de présence. 23 L'utilisateur doit charger un chier de points de présence et indiquer le nom du jeu de points de présence / absence à créer. Plusieurs paramètres sont à dénir pour eectuer un tirage aléatoire des points d'absence : - Résolution de la grille (en mètres) pour dénir la taille des cellules dans lesquelles seront éventuellement tirés des points d'absence. Le bouton actualiser la grille permet d'acher la grille selon la résolution choisie - Distance minimale entre les points (en mètres) : cette fonction permet d'atténuer les eets d'autocorrélation spatiale en restreignant la recherche des points d'absence générés aux zones situées à une distance minimale des points de présence. - Type de distance : l'unité de la distance minimale entre les points dépend du type de distance utilisé dans le jeu de liens sélectionné. - Garder un point par cellule : cette option permet de ne garder qu'un point de présence dans chaque cellule pour éviter les eets de grappe et atténuer l'autocorrélation spatiale. 9.4 Modèle de distribution d'espèce Si un jeu de points de présence / absence a été déni, le logiciel permet d'utiliser les métriques de connectivité calculées à partir d'un graphe comme variables prédictives dans un modèle de distribution d'espèce, suivant le menu Analyse / Estimation du modèle. Cette modélisation est possible même si les points ne sont pas situés dans les taches d'habitat, par le biais d'une extrapolation spatiale des valeurs des métriques. Le modèle est une régression logistique fondé sur la minimisation du critère AIC. 24 Au préalable, l'utilisateur doit indiquer : - le jeu de données ponctuelles à analyser ; - la variable cible dans le modèle prédictif ; - le graphe de référence pour l'utilisation des métriques de connectivité. 9.4.1 Pondérations pour l'extrapolation des métriques au niveau des points Les valeurs des métriques sont calculées pour chaque point d'analyse par le biais d'une interpolation spatiale. Celle-ci est fondée sur une pondération des valeurs par une fonction décroissante à partir du bord des taches (poids de 1). Le poids décroit selon une fonction exponentielle négative de la même forme que celle qui est utilisée pour les métriques pondérées (voir 6.2.1), c'est pourquoi on retrouve le même réglage. L'utilisateur choisi une distance (d) correspondant à une certaine probabilité (p) et le logiciel en déduit la valeur du paramètre α. En principe, ce réglage est à rendre cohérent avec le choix du graphe de référence ou le choix des éventuelles métriques pondérées qui sont à mobiliser, en utilisant la même valeur de d. L'option Connexion multiple permet de faire intervenir plusieurs taches dans le calcul des métriques au niveau des points. Le calcul est fondé sur une moyenne pondérée des valeurs issues de toutes les taches comprises dans le voisinage des points, jusqu'à la Distance maximale indiquée. Les détails de cette forme de pondération sont donnés dans [Foltête et al.(2012b)]. 9.4.2 Estimation du modèle Le choix d'un graphe pour appliquer le modèle fait apparaître toutes les métriques de connectivité disponibles parmi les variables prédictives. Des métriques dérivées d'autres graphes peuvent être ajoutées en cliquant sur le bouton Variable tache. Des variables provenant d'autres sources peuvent aussi être ajoutées, en cliquant sur le bouton Variable externe. 25 Une fois que les variables prédictives que l'utilisateur veut intégrer sont en place, le bouton Estimer permet de calculer les coecients de la régression logistique. Les résultats s'achent sur la partie droite de la fenêtre. L'option Meilleur modèle consiste à tester toutes les combinaisons de variables et de sélectionner celle qui minimise le critère AIC. 9.4.3 Utilisation du modèle Un modèle prédictif considéré comme valide peut être utilisé de plusieurs façons. Suivant le bouton Exporter, le tableau contenant toutes les variables statistiques impliquées dans la régression peut être exporté au format *.csv. Le bouton Extrapoler permet d'estimer la probabilité de présence de l'espèce dans toutes les cellules d'une grille. Dans la nouvelle fenêtre qui s'ache, l'utilisateur retrouve les paramètres du modèle tels qu'ils ont été décrits précédemment. La résolution de la grille (en mètres) indique le niveau de précision spatiale selon lequel cette extrapolation est eectuée. Ce critère a une forte incidence sur le temps de calcul nécessaire pour obtenir le résultat. Le résultat est archivé sous forme de couche raster au format *.tif et aché dans la fenêtre principale. Références : [Foltête et al.(2012b), Foltête et al.(2012a), Girardet et al.(2013), Clauzel et al.(2013)] 10 Achage 10.1 Propriétés des graphes Les propriétés des graphes sont accessibles par un clic droit sur le nom du graphe. Deux modes de visualisation des graphes sont disponibles : La vue topologique ache une vue simpliée du graphe où les n÷uds sont représentés par des cercles et les liens par des lignes droites de centroïde à centroïde. 26 La vue réaliste ache les taches d'habitat selon leurs limites réelles et les liens sont représentés par les chemins de moindre coût entre deux taches. Gauche : vue topologique - Droite : vue réaliste L'entrée Supprimer permet de supprimer le graphe sélectionné. Le projet est enregistré automatiquement après cette suppression. L'entrée Propriétés rappellent les paramètres utilisés pour la construction du graphe : le nom du graphe, le jeu de liens sélectionné, le type de graphe avec éventuellement la distance maximale utilisée et le nombre de liens. L'entrée Matrice OD (matrice Origine-Destination) permet de créer un tableau indiquant la distance entre chaque paire de n÷uds pour le graphe sélectionné. L'unité de la distance dépend du type de distance utilisé pour ce graphe. L'absence de connexion entre deux n÷uds est notée NaN (Not a Number). Cette matrice est archivée dans le dossier du projet sous la forme d'un chier texte nommé nom du graphe-odmatrix.txt . 10.2 Propriétés des objets Les propriétés de chaque jeu de liens, des éléments d'un graphe (n÷uds, liens ou composantes) et des données ponctuelles sont accessibles par un clic droit sur chacun d'entre eux. Le menu Style donne accès aux paramètres d'achage des objets : couleur, épaisseur des contours, étiquettes, taille des symboles (pour les n÷uds uniquement). Les objets peuvent être représentés de la même manière (symbole unique) ou en fonction d'un attribut. Il est possible d'appliquer une méthode de discrétisation pour classer les objets en fonction des valeurs de l'attribut sélectionné. Par défaut, la légende des objets est achée dans la table des matières. Il est possible de la cacher en décochant le bouton Légende. Le menu Export permet d'exporter les objets dans un chier vecteur (*.shp), geopackage (*.gpkg) ou un chier texte (*.txt). Le menu Statistiques permet d'acher la distribution des valeurs d'un ou plusieurs attributs : nuage de point : ache un nuage de point mettant en relation les valeurs de deux attributs histogramme : ache l'histogramme des valeurs d'un attribut. Il est également possible d'acher les valeurs d'un objet particulier en le sélectionnant à l'aide de la èche. Après sélection, la valeur des attributs s'ache dans une nouvelle colonne à droite. Il est possible de fermer cette colonne en cliquant sur le menu Propriétés dans la barre du haut. 27 11 Capacités de traitement et limitations Les méthodes basées sur les graphes sont connues pour fournir un cadre de modélisation ecace, mais peuvent poser une question de capacité de calcul. Deux points spéciques ont reçu une attention particulière dans Graphab : (1) le calcul des jeux de liens, (2) le calcul des métriques de connectivité. Tous ces calculs ont été optimisés par parallélisation. Ce mode de développement améliore l'ecacité de calcul en utilisant une architecture multiprocesseur, un processeur quatre-c÷ur permettant théoriquement un calcul quatre fois plus rapide. Dans [Foltête et al.(2012a)], plusieurs tests ont été eectués an de mesurer la capacité de calcul de Graphab dans diérentes congurations. Trois congurations ont été comparées : 1) un c÷ur (3Go RAM) correspondant à un ordinateur standard ; 2) quatre c÷urs (6 Go RAM) correspondant à une station de travail ; 3) 20 c÷urs (15 Go RAM) correspondant à un serveur. La carte d'occupation du sol était un chier raster de 14000*18000 pixels (252 millions de pixels) représentant l'occupation du sol de la région Franche-Comté (France) à une résolution spatiale de 10 mètres. La carte contenait 22 634 taches d'habitats. Le tableau 3 donne quelques temps de calcul pour la création de liens. Topologie Complète Planaire Distance Euclidienne Moindre coût Euclidienne Moindre coût Ordinateur standard 1927s (32 min) 19252s (5h 21 min) 43s 1080s (18 min) Station de travail 516s (8 min) 4301s (1h 11 min) 12s 295s (5 min) Serveur 133s (2 min) 1037s (17 min) 2.6s 82s (1 min) Table 3 Temps de calcul (en seconde) pour la création de diérents jeux de liens. 28 La mémoire allouée au programme joue aussi un rôle important. Si il n'y a pas assez de mémoire vive, le calcul sera plus lent voire même ne pourra pas aboutir (message OutOfMemoryError ou GC Overhead). Le menu Fichier / Préférences / Mémoire permet de régler la mémoire allouée pour Graphab. Si vous avez une version 32 bits de Java, Graphab sera limité à environ 2 Go (2000 Mo) de mémoire. Si votre ordinateur a plus que 2 Go de mémoire vive il est fortement conseillé d'installer une version 64 bits de Java pour utiliser la mémoire disponible au-delà des 2 Go. 12 Métriques Famille Métrique de connectivité Code Métriques pondérées Flux Connectivité équivalente Probabilité de Connectivité Flux d'interaction (remplace FPC) Fractions de delta Probabilité de Connectivité Indice de centralité intermédiaire Indice Intégral de Connectivité Flux circuit Métriques de surface Taille moyenne des composantes Taille de la plus grande composante Probabilité de coïncidence de classe Taille de composante attendue Métriques topologiques Degré du noeud Coecient de groupement Centralité de proximité Excentricité Corrélation de connectivité Nombre de composantes Diamètre Indice d'Harary Lambda de Wilks F EC PC IF dPC BC IIC CF MSC SLC CCP ECS Dg CC CCe Ec CCor NC GD H W Niveau de calcul Delta Global Comp. Local métrique Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Table 4 Tableau récapitulatif des métriques présentes dans Graphab 29 Ö Ö Ö Terme n nc nk Ni ai ac k A dij e−αdij α β Signication Nombre de taches Nombre de composantes Nombre de taches de la composante k Ensemble des taches voisines de la tache i Capacité de la tache i (en général sa surface) Capacité de la composante k (somme des capacités des taches qui la composent) Surface de la zone d'étude distance entre les taches i et j (en général la distance de moindre coût qui les sépare) Probabilité de déplacement entre les taches i et j Frein de la distance vis-à-vis des déplacements Exposant permettant de pondérer plus ou moins la capacité Table 5 Termes mathématiques utilisés 12.1 Métriques pondérées 12.1.1 Flux Flux (F ) Niveau global Formule S#F = Signication n n X X i=1 aβj e−αdij j=1 Pour le graphe entier : somme des dispersions potentielles à partir de toutes les taches. j6=i Fi = Niveau local n X j=1 j6=i Valeurs Commentaire Références aβj e−αdij Pour la tache focale i : somme des capacités des taches diérentes de i et pondérées en fonction de leur distance minimale à la tache focale en parcourant le graphe. Cette somme est un indicateur de la dispersion potentielle à partir de la tache i, ou inversement à destination de la tache i. Les valeurs dépendent de la dénition de a. Si a représente une surface, F exprime une surface. Valeur minimale : 0 Valeur maximale : surface totale de l'habitat Le chemin du graphe utilisé est celui qui maximise e−αd , c'est-à-dire celui qui minimise la distance d (ou le coût) entre les taches i et j . Cette métrique est appelée Area Weigthed Flux (AWF) dans certaines références. Dans Graphab cependant, a est plus général car il représente la capacité des taches, qui peut être leur surface ou un autre critère choisi par l'utilisateur. De même la pondération est variable en fonction du paramètre β . Dans CS22, AWF est calculé seulement à partir des taches reliées directement à la tache focale, alors que Graphab tient compte des taches indirectement connectées. [Urban and Keitt(2001)] [Saura and Torné(2009)] [Foltête et al.(2012b)] 30 12.1.2 Connectivité équivalente Connectivité équivaFormule lente (EC ) Niveau global Niveau composante Delta Valeurs Commentaire Référence Signication v uX n u n X EC = t ai aj e−αdij i=1 j=1 Racine carrée de la somme des produits de la capacité de tous les couples de taches pondérées par leur probabilité d'interaction. L'unité correspond à l'unité des capacités des taches. Valeur minimale : 0 Valeur maximale : capacité totale des taches Pour chaque couple de taches, le chemin du graphe utilisé est celui qui maximise e−αd , c'est-à-dire celui qui minimise la distance d (ou le coût) entre les taches i et j. [Saura et al.(2011)] 12.1.3 Probabilité de Connectivité Probabilité de Formule Connectivité (P C ) Niveau global Niveau composante Delta Valeurs Commentaire Référence PC = n n 1 XX ai aj e−αdij A2 i=1 j=1 Signication Somme des produits de la capacité de tous les couples de taches pondérées par leur probabilité d'interaction, divisée par le carré de la zone d'étude. Ce rapport équivaut à la probabilité que deux individus tirés au hasard dans la zone d'étude parviennent à entrer en contact. Les valeurs correspondant à une probabilité. Valeur minimale : 0 Valeur maximale : 1 Pour chaque couple de taches, le chemin du graphe utilisé est celui qui maximise e−αd , c'est-à-dire celui qui minimise la distance d (ou le coût) entre les taches i et j. Cette métrique est désactivée si a ne représente pas la surface des taches. [Saura and Pascual-Hortal(2007)] 31 12.1.4 Flux d'interaction (remplace FPC) Flux d'interaction (IF ) Formule Niveau local IF i = n X aβi aβj e j=1 Valeurs Commentaire Références −αdij Signication Somme des produits de la capacité de la tache focale avec toutes les autres taches, pondérées par leur probabilité d'interaction. Cette métrique remplace l'ancienne métrique F P C nommée P Cf lux dans les articles. Valeur minimale : 0 Valeur maximale : somme des capacités Pour chaque couple de taches, le chemin du graphe utilisé est celui qui maximise e−αd , c'est-à-dire celui qui minimise la distance d (ou le coût) entre les taches i et j. Cette métrique correspond à la contribution locale d'une tache à l'indice P C : P PC = A12 i IF i avec β = 1. Elle équivaut à dP C f lux + dP C area non divisé par la valeur globale du P C . Cependant la métrique IF est obtenue plus rapidement car son calcul n'est pas fondé sur la suppression itérative des taches (mode delta). [Foltête et al.(2014)],[Sahraoui et al.(2017)] 12.1.5 Fractions de delta Probabilité de Connectivité Fractions de delta Probabilité de Connectivité (dP C , dP Carea , dP Cf lux , dP Cconnector ) Formules Signication Taux de variation entre la valeur de l'indice PC et la 0 (PC − PC i ) valeur PC' représentant la suppression de la tache i. dPC i = La valeur de dP C se décompose en trois parties : PC - dP Carea correspond à la variation due à la perte dPC i = dPC area +dPC flux +dPC connector de la surface suite à la suppression de la tache i ; Delta a2i dP Cf lux correspond à la variation due à la perte dPC area = 2 A PC des interactions entre la tache i et les autres taches ; IF i - dP Cconnector correspond à la variation due à la dP C f lux = − dP C area modication des chemins reliant les autres taches et PC passant initialement par i. Valeur minimale : 0 Valeurs Valeur maximale : 1 Commentaire Si a ne représente pas la surface des taches, dP Carea n'exprime pas une perte de surface mais de capacité. Référence [Saura and Rubio(2010)] 32 12.1.6 Indice de centralité intermédiaire Indice de centralité Formule intermédiaire (BC ) BC i = Niveau local Signication XX j aβj aβk e−αdjk k j, k∈ {1..n} , k < j, i∈Pjk Valeurs Commentaire Références Somme des plus courts chemins passant par la tache focale i, chaque chemin étant pondéré par le produit des capacités des taches reliées et de leur probabilité d'interaction. Pjk représente l'ensemble des taches traversées par le plus court chemin entre les taches j et k. Les valeurs dépendent du paramétrage. Elles correspondent à un poids de transit potentiel. Valeur minimale : 0 Valeur maximale : surface totale de l'habitat au carré. Avec un paramétrage de α = 0 et β = 0 (pondération uniforme des chemins), on retrouve l'indice BC tel qu'il est utilisé dans d'autres types de graphes. Un paramétrage de α = 0 et β = 1 donne aux chemins un poids égal au produit des capacités des taches qu'ils relient, quelle que soit leur distance. Dans [Foltête et al.(2012a), Foltête et al.(2012b)], l'indice BCl a été proposé pour pondérer plus fortement les chemins supérieurs au critère choisi (distance de dispersion par exemple). Mais des tests ont ensuite montré que cet indice était très fortement corrélé au BC pondéré avec α = 0. Dans [Bodin and Saura(2010)], le BC pc correspond au BC pondéré avec d égal à la distance de dispersion, α tel que e−αd = 0.05 et β = 1. [Bodin and Saura(2010)] [Foltête et al.(2012a)] 12.1.7 Indice Intégral de Connectivité Indice Intégral de Formule Connectivité (IIC ) Niveau global Niveau composante Delta IIC = Signication n n 1 X X ai aj A2 i=1 j=1 1 + nl ij Produit des capacités des taches divisé par le nombre de liens qui les sépare, la somme étant divisée par le carré de la surface de la zone d'étude. IIC est construit comme l'indice PC, mais en utilisant l'inverse d'une distance topologique plutôt qu'une fonction exponentielle négative de la distance basée sur l'impédance des liens. Valeurs Valeur minimale : 0 Valeur maximale : 1 Référence [Pascual-Hortal and Saura(2006)] 33 12.1.8 Flux circuit Flux circuit (CF ) Formule Niveau local CFi = n X cji j Valeurs Commentaire Références Signication Somme des courants traversant la tache focale i. cji représente le courant à travers la tache i lorsque un courant est émis depuis toutes les taches vers la tache j (la tache j est reliée à la terre) Valeur minimale : 0 Valeur maximale : (n − 1)(n − 2) si β = 0 Pn−1 (n − 2) i ai si β = 1 La métrique CF utilise la théorie des circuits électriques. Chaque lien du graphe correspond à une résistance électrique, les sources de courants et la terre sont quant à elles attachées aux taches. Si β = 0 chaque tache émet un courant unitaire, si β = 1 chaque tache émet un courant égal à sa capacité. Cette métrique peut être vue comme un équivalent de la métrique BC (avec α = 0 et β = 0) qui tient compte de l'ensemble des chemins possibles et non pas uniquement du chemin le plus court. [Girardet et al.(2015)] 12.2 Métriques de surface 12.2.1 Taille moyenne des composantes Taille moyenne des Formule composantes (M SC ) Niveau global MSC = Signication nc 1 X ac k nc Moyenne des capacités des composantes. k=1 Valeurs Valeur minimale : capacité minimale Valeur maximale : SLC 12.2.2 Taille de la plus grande composante Taille de la plus grande composante (SLC ) Formule Niveau global Valeurs SLC = max {ac k } Signication Plus grande capacité des composantes. Valeur minimale : capacité minimale Valeur maximale : capacité maximale 34 12.2.3 Probabilité de coïncidence de classe Probabilité de coïncidence de classe (CCP ) Formule Niveau global 2 nc X ac k P CCP = l ac l Signication Probabilité que deux points choisis au hasard sur le graphe appartiennent à la même composante. k=1 Valeurs Référence Valeur minimale : → 0 (autant de composantes que de taches et capacités uniformes) Valeur maximale : 1 (une seule composante) [Pascual-Hortal and Saura(2006)] 12.2.4 Taille de composante attendue Taille de composante Formule attendue (ECS ) Niveau global Signication nc X 1 ac 2k k ac k ECS = P Taille attendue d'une composante k=1 Valeurs Référence Valeur minimale : capacité minimale (autant de composantes que de taches et capacités uniformes) Valeur maximale : somme des capacités (1 seule composante) [O'Brien et al.(2006)] 12.3 Métriques topologiques 12.3.1 Lambda de Wilks Lambda de Wilks Formule (W ) Niveau global Values Reference WLambda = Signication |W | |T | Rapport entre la (co)variance intra-classe (intra composante) |W | et la (co)variance totale |T |. Valeur minimale : 0 les taches appartenant à la même composante sont identiques pour toutes les variables sélectionnées. Valeur maximale : 1 les taches appartenant à la même composante ont leurs variables qui dièrent autant entre elles qu'avec les autres taches. [Everitt and Dunn(2001)], [Foltête and Vuidel(2017)] 35 12.3.2 Indice d'Harary Indice d'Harary (H ) Formule Niveau global Niveau composante Delta H= Signication n n 1X X 1 2 i=1 nl ij j=1 Somme de l'inverse du nombre de liens séparant tous les couples de taches. j6=i Valeurs Valeur minimale : 0 pour un graphe sans lien (autant de composantes que de taches) Valeur maximale : n(n−1) pour un graphe complet 2 Commentaire Référence Pour les couples de taches non connectées par un chemin on a : nl ij = +∞ [Ricotta et al.(2000)] 12.3.3 Diamètre Diamètre (GD) Formule Niveau global Niveau composante Delta Signication GD = max dij ij GD = max Ec i Distance la plus grande entre deux taches du graphe i Valeurs Valeur minimale : 0 Valeur maximale : +∞ Commentaire Quand les n÷uds i et j ne sont pas connexes dij = 0 Cette métrique est la version globale de la métrique Ec i 12.3.4 Nombre de composantes Nombre de compoFormule santes (N C ) Niveau global Valeurs Signication NC = nc Nombre de composantes du graphe Valeur minimale : 1 Valeur maximale : n 36 12.3.5 Degré du noeud Degré du noeud (Dg ) Formule Niveau local Signication Nombre de liens connectés au noeud i ie. nombre de taches voisines de la tache i Dg i = |Ni | Valeurs Valeur minimale : 0 Valeur maximale : n Commentaire Il y a équivalence entre le degré d'un n÷ud et le nombre de n÷uds voisins car les graphes ne sont pas orientés et ne contiennent pas de boucle. 12.3.6 Coecient de groupement Coecient de grouFormule pement (CC ) Niveau local CC i = Signication X 1 Rapport du nombre de n÷uds voisins de i voi|Ni ∩Nj | sins entre eux sur le total possible. |Ni | (|Ni | − 1) j∈Ni Valeurs Commentaire Valeur minimale : 0 Valeur maximale : 1 Si |Ni | ≤1 → CC i = 0 12.3.7 Centralité de proximité Centralité de proxiFormule mité (CCe) Niveau local CCe i = Signication nk X 1 dij nk − 1 j=1 Distance moyenne de la tache i vers toutes les autres taches de sa composante k. j6=i Valeurs Valeur minimale : 0 Valeur maximale : +∞ Commentaire Si nk = 1 → CCe i = 0 37 12.3.8 Excentricité Excentricité (Ec) Niveau local Formule Signication Ec i = max dij j Valeurs Distance maximale de la tache i vers une autre tache de sa composante. Valeur minimale : 0 Valeur maximale : +∞ 12.3.9 Corrélation de connectivité Corrélation de Formule connectivité (CCor) Niveau local Signication 2 CCor i = P |Ni | j∈Ni Valeurs Commentaire Référence |Nj | Rapport entre le degré du n÷ud i et le degré de ses n÷uds voisins j Valeur minimale : 0 Valeur maximale : |Ni | Si |Ni | = 0 → CCor i = 0 [Minor and Urban(2008)] 38 Références [Bodin and Saura(2010)] Orjan Bodin and Santiago Saura, 2010. Ranking individual habitat patches as connectivity providers : Integrating network analysis and patch removal experiments. Ecological Modelling, 221(19) 2393 2405. [Brandes et al.(2008)] U. Brandes, D. Delling, M. Gaertler, R. Gorke, M. Hoefer, Z. Nikoloski, and D. Wagner, 2008. On modularity clustering. Knowledge and Data Engineering, IEEE Transactions on, 20(2) 172 188. [Clauzel et al.(2015a)] Celine Clauzel, Cyrielle Bannwarth, and Jean-Christophe Foltete, 2015a. Integrating regional-scale connectivity in habitat restoration : An application for amphibian conservation in eastern france. Journal for Nature Conservation, 23 98 107. [Clauzel et al.(2015b)] Celine Clauzel, Deng Xiqing, Wu Gongsheng, Patrick Giraudoux, and Li Li, 2015b. Assessing the impact of road developments on connectivity across multiple scales : Application to yunnan snub-nosed monkey conservation. Biological Conservation, 192 207 217. [Clauzel et al.(2013)] Céline Clauzel, Xavier Girardet, and Jean-Christophe Foltête, 2013. Impact assessment of a high-speed railway line on species distribution : Application to the european tree frog (hyla arborea) in franche-comté. Journal of Environmental Management, 127 125 134. [Everitt and Dunn(2001)] Brian S Everitt and Graham Dunn, 2001. Applied multivariate data analysis, volume 2. Wiley Online Library. [Foltête and Vuidel(2017)] Jean-Christophe Foltête and Gilles Vuidel, 2017. Using landscape graphs to delineate ecologically functional areas. Landscape Ecology, 32(2) 249263. [Foltête et al.(2021)] Jean-Christophe Foltête, Gilles Vuidel, Paul Savary, Céline Clauzel, Yohan Sahraoui, Xavier Girardet, and Marc Bourgeois, 2021. Graphab : an application for modeling and managing ecological habitat networks. Software Impacts, 8 100065. [Foltête et al.(2012a)] Jean-Christophe Foltête, Céline Clauzel, and Gilles Vuidel, 2012a. A software tool dedicated to the modelling of landscape networks. Environmental Modelling and Software, 38 316 327. [Foltête et al.(2012b)] Jean-Christophe Foltête, Céline Clauzel, Gilles Vuidel, and Pierline Tournant, 2012b. Integrating graph-based connectivity metrics into species distribution models. Landscape Ecology, 27(4) 557569. [Foltête et al.(2014)] Jean-Christophe Foltête, Xavier Girardet, and Céline Clauzel, 2014. A methodological framework for the use of landscape graphs in land-use planning. Landscape and Urban Planning, 124 140 150. [Girardet et al.(2015)] Xavier Girardet, Géraldine Conruyt-Rogeon, and Jean-Christophe Foltête, 2015. Does regional landscape connectivity inuence the location of roe deer roadkill hotspots ? European Journal of Wildlife Research, 61(5) 731742. [Girardet et al.(2013)] Xavier Girardet, Jean-Christophe Foltête, and Céline Clauzel, 2013. Designing a graph-based approach to landscape ecological assessment of linear infrastructures. Environmental Impact Assessment Review, 42 10 17. [McRae et al.(2008)] Brad H. McRae, Brett G. Dickson, Timothy H. Keitt, and Viral B. Shah, 2008. Using circuit theory to model connectivity in ecology, evolution, and conservation. Ecology, 89(10) 2712 2724. [Minor and Urban(2008)] Emily Minor and Dean Urban, 2008. A graph-theory framework for evaluating landscape connectivity and conservation planning. Conservation biology, 22 297307. [Newman(2006)] M. E. J. Newman, 2006. Modularity and community structure in networks. Proceedings of the National Academy of Sciences, 103(23) 85778582. [O'Brien et al.(2006)] Dan O'Brien, Micheline Manseau, Andrew Fall, and Marie-Josée Fortin, 2006. Testing the importance of spatial conguration of winter habitat for woodland caribou : An application of graph theory. Biological Conservation, 130(1) 70 83. [Pascual-Hortal and Saura(2006)] Lucía Pascual-Hortal and Santiago Saura, 2006. Comparison and development of new graph-based landscape connectivity indices : towards the priorization of habitat patches and corridors for conservation. Landscape Ecology, 21(7) 959967. 39 [Ricotta et al.(2000)] C. Ricotta, A. Stanisci, G.C. Avena, and C. Blasi, 2000. Quantifying the network connectivity of landscape mosaics : a graph-theoretical approach. Community Ecology, 1(1) 8994. [Sahraoui et al.(2017)] Yohan Sahraoui, Jean-Christophe Foltête, and Céline Clauzel, 2017. A multi-species approach for assessing the impact of land-cover changes on landscape connectivity. Landscape Ecology, 32(9) 18191835. [Saura et al.(2011)] Santiago Saura, Christine Estreguil, Coralie Mouton, and Mónica Rodríguez-Freire, 2011. Network analysis to assess landscape connectivity trends : Application to european forests (19902000). Ecological Indicators, 11(2) 407 416. [Saura and Pascual-Hortal(2007)] Santiago Saura and Lucía Pascual-Hortal, 2007. A new habitat availability index to integrate connectivity in landscape conservation planning : Comparison with existing indices and application to a case study. Landscape and Urban Planning, 83(23) 91 103. [Saura and Rubio(2010)] Santiago Saura and Lidón Rubio, 2010. A common currency for the dierent ways in which patches and links can contribute to habitat availability and connectivity in the landscape. Ecography, 33(3) 523537. [Saura and Torné(2009)] Santiago Saura and Josep Torné, 2009. Conefor sensinode 2.2 : A software package for quantifying the importance of habitat patches for landscape connectivity. Environmental Modelling and Software, 24(1) 135 139. [Urban and Keitt(2001)] Dean Urban and Timothy Keitt, 2001. Landscape connectivity : A graph-theoretic perspective. Ecology, 82(5) 12051218. 40