Recherchez une offre d'emploi
Thèse Conception de Modèles d'Intelligence Artificielle pour l'Évaluation Rapide et Efficace de l'État de Communautés Végétales Entomophiles Méditerranéennes H/F - 34
Description du poste
- Doctorat.Gouv.Fr
-
Montpellier - 34
-
CDD
-
Publié le 1 Avril 2026
Établissement : Université de Montpellier
École doctorale : GAIA - Biodiversité, Agriculture, Alimentation, Environnement, Terre, Eau
Laboratoire de recherche : ISEM - Institut des Sciences de l'Evolution -Montpellier
Direction de la thèse : Céline DEVAUX ORCID 0000000251922828
Début de la thèse : 2026-10-01
Date limite de candidature : 2026-05-07T23:59:59
Le projet proposé utilisera les développements récents en analyse d'images par intelligence artificielle afin d'établir une méthode quantitative, efficace, robuste et automatique de la composition en espèces végétales entomophiles échantillonnées par des abeilles. L'idée est de pouvoir obtenir rapidement l'état d'une communauté végétale simplement en échantillonnant quelques pollinisateurs en un site, et ainsi de contribuer à construire des protocoles réplicables et simples qui permettent le suivi temporel ou spatial de la diversité végétale, tant affectée par les changements globaux. Pour y parvenir, le travail de doctorat devra lever plusieurs verrous, techniques, fondamentaux ou encore théoriques, et se fera à l'interface de plusieurs disciplines, comme la palynologie, l'écologie, l'informatique, et les statistiques.
La reconnaissance d'objets dans des images est maintenant réalisée par intelligence artificielle (IA) avec de bonnes performances (justesse et précision). En palynologie, l'IA sert à identifier l'espèce végétale de grains de pollen à partir de leur morphologie et leurs ornementations, afin de publier, par exemple, des bulletins préventifs d'allergologie (Buters et al. 2024) ou des changements de composition végétale (Bourel et al. 2020). Le projet souhaite construire une telle méthode d'IA de reconnaissance de grains de pollen dans le but de décrire, avec le plus de justesse et de précision possibles, la composition des plantes visitées par des abeilles, en identifiant les espèces de pollen sur leur corps.
Malgré la progression spectaculaire de l'IA en reconnaissance de pollen, i.e. l'augmentation des performances des modèles sur des jeux de données de plus en plus gros, beaucoup de travail est encore nécessaire pour obtenir une méthode performante et fiable sur des échantillons récoltés dans la nature, car:
(i) peu d'études d'IA sur le pollen ont traité ce type d'échantillons, qui contiennent des pollens en mélange car issus d'espèces différentes, changeant d'un site ou d'une année à l'autre, et des débris végétaux, animaux et fongiques, pouvant ressembler à du pollen. Au contraire, beaucoup d'études ont montré de bonnes performances de l'IA sur des images moins complexes, et ainsi favorables: des images contenant seulement des grains de pollen parfaitement conservés, ou sans débris, ou des pollens de peu d'espèces différentes, ou uniquement d'espèces apprises par les modèles.
(ii) quasi aucune étude n'a réalisé un travail spécifique d'analyse comparative et statistique afin de rendre sa méthode fiable et réplicable entre sites et années sur des échantillons, qu'ils soient récoltés ou non en nature.
Nous sommes pionniers sur les questions méthodologiques liées à ces deux écueils via des travaux sur des échantillons récoltés dans la nature. (i) Pour l'acquisition (segmentation) des images de grains de pollens, nous montrons que, de manière contre-intuitive, il est préférable de ne pas entraîner l'IA à détecter du pollen en indiquant leur espèce (plus de détails) mais de l'entraîner sur une seule catégorie de pollen indifférencié (Gimenez et al. 2024). (ii) Nous avons mis en avant qu'il est préférable non pas de construire une IA qui détecte et identifie l'espèce des grains de pollen en une seule étape, mais de séparer ces étapes de détection et d'identification (Gimenez et al. 2024). (iii) Enfin, nous avons vu que des modèles hybrides incorporant des connaissances métiers et incluant des réseaux d'IA spécialisés dans différentes tâches d'identification taxonomiques permettaient de grandement diminuer les erreurs de classifications (Bourel et al. 2020).
Le projet de doctorat proposé vise à développer des outils réplicables, en science ouverte et faciles à utiliser par toutes et tous, qui à partir du pollen échantillonné par des abeilles permettent d'estimer la composition spécifique d'une communauté végétale entomophile en un site donné. Le but est de pouvoir contribuer à construire des outils simples d'utilisation pour évaluer les effets des changements globaux dans le temps et dans l'espace sur la diversité végétale. Les outils développés utiliseront des développements récents en intelligence artificielle permettant l'analyse d'images de lames polliniques contenant tous les grains de pollen de toutes les espèces végétales visitées par des abeilles.
La personne recrutée devra pour y parvenir lever plusieurs verrous demeurant dans le domaine de la reconnaissance automatique par intelligence artificielle (IA) de grains de pollen dans un mélange :
(1) un verrou technique: garantir l'acquisition d'images dans lesquelles les grains de pollen présents dans un champ microscopique sont visibles et nets, indépendamment de la qualité des échantillons. Ces échantillons peuvent en effet contenir divers types de débris et inclure des grains de pollen présentant une large variabilité dimensionnelle.
(2) un verrou théorique: développer une approche probabiliste robuste de l'estimation de la composition spécifique d'un mélange de pollen, en tenant compte des limites actuelles liées à la calibration des modèles (Guo et al., 2017). L'objectif est d'obtenir une estimation non biaisée, y compris pour des taxons rares, émergents dans un paysage, ou morphologiquement proches.
(3) un verrou fondamental: vérifier dans quelle mesure la composition spécifique des grains de pollen collectés par les abeilles reflète effectivement la diversité des plantes visitées et la composition réelle du couvert végétal. En effet, les abeilles ont tendance à (i) avoir des préférences pour certaines espèces, (ii) visiter les mêmes plantes entre jours (Devaux et al. 2014), et (iii) séparer le pollen qu'elles accumulent sur leurs pattes pour le couvain ou pour leur propre consommation.
Brièvement, l'IA dans ce projet repose sur l'entraînement de modèles sur des photos individuelles de grains de pollen d'espèce connue, la validation de ces modèles, et ensuite l'application de ces modèles sur de nouvelles photos jamais vues précédemment.
Les étapes du projet de doctorat seront les suivantes:
1. produire (a) des lames dites de référence contenant du pollen récolté dans les fleurs des espèces végétales à identifier, i.e. autant d'espèces entomophiles que possible de la région Méditerranéenne, et (b) des lames à tester contenant du pollen récolté sur les abeilles; ce travail nécessitera d'améliorer et rendre réplicables les protocoles expérimentaux disponibles;
2. acquérir les photos de toutes les lames de pollen grâce à un microscope automatique;
3. utiliser la méthode automatique de détection de grains de pollen développée à l'ISEM par Gimenez et al. (2024) pour obtenir des photos individuelles de tous les grains de pollen dans toutes les lames de pollen;
4. entraîner les modèles d'IA à reconnaître les espèces dans la base de données de lames de référence, cette étape demandant un travail conséquent de paramétrage des modèles et d'intégration de connaissance métier;
5. faire une étude bibliographique des développements statistiques en IA permettant d'obtenir la vision probabiliste (souhaitée dans le projet) de la communauté végétale, les récentes études montrant que la donnée brute de sortie des modèles standards de classification (CNN) ne peut pas être considérée comme la confiance associée à une prédiction (Guo et al. 2017);
6. faire une étude des erreurs générées lors de la validation des modèles en utilisant les statistiques révélées les plus pertinentes à l'étape 5, et réaliser une analyse statistique approfondie de ces erreurs (Sont-elles attendues car les grains de pollen se ressemblent? Sont-elles toujours pour les mêmes espèces? Empêchent-elles la reconstitution de la composition végétale? Sont-elles liées à la qualité des photos?)
7. appliquer les modèles entraînés sur les lames de pollen à tester (pollen sur les abeilles) afin d'obtenir leur identification;
8. analyser tous les échantillons de pollen récoltés sur les abeilles afin d'estimer si la communauté végétale prédite par IA est effectivement représentative de celle du terrain (et qui a été indépendamment mesurée).
Compétences requises
- Python
Offres similaires
Ingénieur R&D Intelligence Artificielle H/F
-
Pc Soft Informatique
-
Montpellier - 34
-
CDI
-
17 Mars 2026
Ingénieur IA Gen H/F
-
DEODIS
-
Montpellier - 34
-
CDI
-
11 Mars 2026
Thèse Exploration des Similarités et des Différences Topologiques de Graphes de Pangénomes pour Mieux Analyser la Diversité Génétique et les Processus Évolutifs Entre Espèces H/F
-
Doctorat.Gouv.Fr
-
Montpellier - 34
-
CDD
-
1 Avril 2026
Déposez votre CV
Soyez visible par les entreprises qui recrutent à Montpellier.
Chiffres clés de l'emploi à Montpellier
- Taux de chomage : 14%
- Population : 295542
- Médiane niveau de vie : 18870€/an
- Demandeurs d'emploi : 39020
- Actifs : 134890
- Nombres d'entreprises : 30684
Sources :
Un site du réseaux :