Raed Halawi Ghosn (Laboratoire Ifremer-Boulogne-Sur-Mer) soutiendra sa thèse le 18 septembre 14h00 à l’amphithéâtre du Centre Universitaire ULCO de Capécure, quai Robert Masset, 62200 Boulogne-sur-mer. La thèse est co-dirigée par Alain Lefebvre du laboratoire Ifremer-Boulogne-Sur-Mer, et Emilie Caillault-Poisson du LISIC.
Titre :
Machine Learning and Harmful Phytoplankton: Definition of Environmental States Favorable for Blooms, and Development of an Expert Forecasting, Warning, and Decision-Making System
Résumé :
Le phytoplancton est constitué de l’ensemble des organismes photosynthétiques présents à la base de la chaîne alimentaire. Il soutient les niveaux trophiques supérieurs et joue un rôle crucial dans les cycles biogéochimiques. Sa biomasse peut augmenter lorsque les conditions sont favorables (i.e., lumière et nutriments), conduisant à des efflorescences algales toxiques et/ou nuisibles (HABs) et pouvant être liées à l’eutrophisation. Les HABs peuvent être à l’origine de la présence de toxines dans l’eau, provoquant la mort de certains organismes marins et impactant la biodiversité marine. Ils peuvent également impacter l’économie et les activités récréatives, et avoir des effets néfastes sur la santé humaine lorsque des coquillages contaminés sont consommés. L’objectif de cette thèse est de développer un système numérique expert capable de prédire les HABs et d’alerter les professionnels de la mer, les gestionnaires de l’environnement et les décideurs dans trois régions principales : (1) la Manche orientale, (2) la Manche centrale et (3) la mer d’Iroise. Pour atteindre cet objectif, une approche intégrée multi-source, multi-paramètre, multi-critère, multi-échelle et multi- fréquence est adoptée, combinant des données in situ, satellitaires et de modélisation. Plusieurs étapes de traitement ont été effectuées sur les données avec notamment la correction des décalages temporels et la complétion des valeurs manquantes, l’optimisation de la phase de contrôle qualité des données. Une fois validés et qualifiés, les jeux de données utilisés dans ces travaux ont été classifiés en utilisant l’algorithme de clustering spectral multi-niveaux (M-SC). Par ailleurs, au regard des connaissances acquises et inspiré par le concept du Mandala de Margalef, un nouveau diagramme de Margalef étendu a été développé. Les groupes (clusters) obtenus, donc les états environnementaux caractéristiques de la dynamique des efflorescences algales, ont ensuite été étiquetés en lien avec les experts des régions étudiées. Ensuite, l’algorithme Random Forest (RF) a été utilisé pour développer un modèle capable de prédire les groupes donc les états environnementaux à partir de nouveaux jeux de données. Il est important de souligner que la nouveauté de ce système de prévision et d’alerte réside dans le concept semi-supervisé combinant l’algorithme non supervisé (M-SC) avec un modèle Random Forest. Nos résultats indiquent que le M-SC est capable de révéler plusieurs états environnementaux tels que les événements récurrents, rares et extrêmes, y compris les efflorescences algales nuisibles. Nous montrons également que le système expert a permis d’obtenir des résultats pertinents pour la prédiction des états environnementaux de 2 à 10 jours.
Mots clés:
Machine Learning – Phytoplancton – Eutrophisation – Algues Nuisibles – Observation Intégrée – Système de Prévision.
Jury:
M. Pascal CLAQUIN, Professor, Université de Caen (Reviewer)
M. Laurent COPPOLA, CNAP-HDR, Sorbonne Université (Reviewer)
Mme Anouk BLAUW, Research Associate, Deltares, NL (Examiner)
M. Eric THIEBAUT, Professor, Sorbonne Université (Examiner)
M. Alain LEFEBVRE, HDR, Ifremer-Boulogne-Sur-Mer (Advisor)
Mme Émilie POISSON-CAILLAULT, Professor, ULCO (Co-Advisor)