Affordable Access

De la conception d'un système d'observation à large échelle au déploiement et à l'exploitation de son système d'information : application à l'observation des habitats coralligènes et à la colonisation de récifs artificiels (ARMS)

Authors
  • David, Romain
Publication Date
Jul 06, 2018
Source
HAL-UPMC
Keywords
Language
French
License
Unknown
External links

Abstract

Dans le domaine de l’environnement marin, des protocoles d’observation développés dans de nombreux cadres produisent un grand volume de données hétérogènes, difficiles à agréger car centrées sur l’utilisation souvent spécifique à un métier. L’accès et le partage des données à large échelle est pourtant incontournable pour mieux cerner les enjeux de protection de la biodiversité et des ressources marines, et anticiper leur détérioration irréversible. Pour répondre à ces enjeux, il est nécessaire de renforcer l’efficacité des systèmes d’acquisition de connaissances, et d’organiser l’accès aux données pour tous les utilisateurs potentiels. Améliorer la cohérence entre systèmes d’observation et systèmes d’information est l’objectif cadre de ce travail. La mise en place efficace de systèmes d’observation à large échelle nécessite un état des lieux des connaissances, des compétences disponibles et des verrous à lever. Les réseaux de suivi pour la protection environnementale deviennent multi-usagers et doivent produire suffisamment de descripteurs fiables pour élaborer une indication et un reportage performants.Ce travail propose i) des méthodes, protocoles et recommandations pour construire et/ou soutenir la mise en place de réseaux de suivis de la biodiversité (du gène aux espèces et aux habitats), opérationnels et pérennes à toutes les échelles, ii) des utilisations novatrices des données, de leur conservation et de l’organisation de leurs accès permanent.Deux cas d’étude ont été choisis : les habitats coralligènes à l’échelle de la Méditerranée et la colonisation de récifs artificiels (ARMS) dans différentes mers régionales, en focalisant sur : la construction de réseaux de suivi et d’observation pérennes, le partage efficace et l’inter-opération des connaissances à long terme et les méthodes d’analyses de données exploitant les avancées dans le domaine du Big Data, et de l’analyse de données hétérogènes sous forme de graphes.Le test des protocoles élaborés dans le cadre de cette thèse montre qu’une expérimentation à large échelle doit être décrite très explicitement dans des termes standardisés au-delà du champ disciplinaire de l’écologie marine et se baser sur des méthodes de mesures les plus simples possibles. Ces tests ont aussi montré l’importance de la formation des opérateurs et d’une intercalibration itérative.Le travail sur l’architecture des systèmes d’information met en évidence l’inévitabilité d’un système de gestion modulaire, orienté “métier” et décentralisé. Un mécanisme de couplage de données de différentes origines accessibles sous forme de flux paramétrables et ouverts est proposé (observations de terrain et données décrivant les contextes). Il s’appuie sur la requalification des facteurs descriptifs hétérogènes reposant sur un arbitrage collaboratif entre spécialistes. Grâce au développement d’un prototype, une méthode d’analyse et de fouille de données basé sur la théorie des graphes a été expérimentée. Différents types de démonstrations possibles partant des données ont été construits grâce à l’organisation d’ateliers multidisciplinaires de curation et de visualisation de données sous forme de graphes.En conclusion, nous recommandons que l’information produite soit contrôlée par itérations en temps réel et que les processus de curation de la donnée soient mis en œuvre en même temps que la conception des procédés d’observation. Les définitions de standards et les accès aux données de contextes nécessitent un travail collaboratif, interdisciplinaire, itératif produit sur le long terme sur un plan international. Ils doivent être considérés pour toutes leurs utilisations possibles.En perspective, l’utilisation de la grille de calcul pour faire de la fouille de graphes de manière parallélisée a été préparée lors des ateliers, avec le challenge d’un passage à l’échelle avec des données distribuées et très hétérogènes formant des graphes de plus d’un milliard de nœuds et plusieurs centaines de milliards de liens.

Report this publication

Statistics

Seen <100 times