Recherchez une offre d'emploi

Thèse Nouvelles Stratégies d'Estimation Non-Paramétrique dans les Modèles de Guérison. H/F - 34

Description du poste

Établissement : Université de Montpellier
École doctorale : I2S - Information, Structures, Systèmes
Laboratoire de recherche : IMAG - Institut Montpelliérain Alexander Grothendieck
Direction de la thèse : Élodie BRUNEL ORCID 0000000325424005
Début de la thèse : 2026-10-01
Date limite de candidature : 2026-05-04T23:59:59

Dans un contexte marqué par l'augmentation des maladies chroniques, la recherche clinique joue un rôle central dans l'évaluation des interventions médicales et des facteurs influençant la santé des individus. Les méthodes statistiques d'analyse de survie, qui consistent à étudier le temps jusqu'à la survenue d'un événement d'intérêt, comme une rechute, sont devenues incontournables. Elle permettent d'analyser l'effet de traitements, de caractéristiques individuelles ou de modes de vie sur l'évolution des patients.
L'analyse de survie repose généralement sur l'hypothèse que tous les individus finiront par présenter l'événement étudié, même si celui-ci n'est pas observé durant la période de suivi. Toutefois, cette hypothèse est souvent irréaliste, car certains patients peuvent ne jamais présenter cet événement. Ces individus sont alors considérés comme guéris ou immunisés, ce qui implique un temps de survenue théoriquement infini. Pour prendre en compte ceci, des modèles spécifiques appelés modèles de guérison ont été développés. Ils permettent de distinguer deux sous-populations : les individus susceptibles de présenter l'événement et ceux qui ne le présenteront jamais. L'intérêt principal de ces modèles est de pouvoir estimer à la fois la probabilité de guérison et la dynamique de survie des individus non guéris, tout en évaluant l'influence de différents facteurs explicatifs. Ils reposent sur une approche de mélange probabiliste séparant la population en deux groupes latents. Les approches classiques utilisent des modèles paramétriques ou semi-paramétriques, mais des méthodes non paramétriques ont également été proposées afin d'offrir davantage de flexibilité face à la complexité des données cliniques.

Le premier objectif du projet est de développer une nouvelle méthode d'estimation non-paramétrique de type moindres carrés de la fonction de risque dans le cadre des modèles de guérison. Cette méthode vise à proposer des estimateurs flexibles, adaptés aux données, et présentant des propriétés statistiques optimales (vitesses de convergence optimale, sélection adaptative des paramètres). Elle sera étudiée tout d'abord introduite dans des contextes simples, puis en présence de variables explicatives.
Le second objectif consiste à intégrer une approche d'inférence causale afin d'évaluer l'effet des traitements sur la survie des patients. L'accent sera mis sur l'utilisation du Restricted Mean Survival Time (RMST), un indicateur permettant de mesurer de manière directe et interprétable le bénéfice clinique d'une intervention sur une période donnée, en comparaison avec les approches classiques basées sur les risques.
Le nouvel estimateur sera ensuite implémenté et appliqué à la fois sur des données simulées et sur des données réelles de patients asthmatiques présents dans les deux cohortes COBRA et RAMSES. Les performances empiriques seront évaluées et comparées aux approches existantes issues de la littérature. Le projet de thèse bénéficiera de la collaboration avec l'Institut Debrest d'Epidémiologie et de Santé Publique (IDESP) qui a une expertise sur ces deux bases de données et avec l'équipe PhyMedEXP UMR INSERM 1046 pour l'expertise clinique.

De nos jours, malgré l'essor des maladies chroniques, des cancers, des maladies auto-immunes, la médecine est en perpétuelle évolution. Avec l'aide des statistiques, la recherche clinique permet d'étudier l'effet d'interventions médicales (traitements médicamenteux, techniques chirurgicales, thérapies cellulaires, etc.) mais aussi l'effet d'autres déterminants (caractéristiques individuelles, alimentation, activité physique, etc.), sur l'état de santé des individus et les possibles améliorations. Dans ce contexte, il est souvent pertinent d'étudier l'effet de ces interventions et caractéristiques sur le temps jusqu'à la survenue d'un évènement d'intérêt, comme le temps jusqu'à la récidive d'une maladie. L'analyse des durées de vie, ou survie, regroupe l'ensemble des méthodes statistiques permettant d'étudier ce type de critère. Ces méthodes reposent sur l'hypothèse que l'ensemble des patients appartenant à la population d'intérêt connaitront l'évènement même si celui-ci ne peut être observé, en raison d'une durée de suivi limitée. Cependant, cette hypothèse n'est pas toujours plausible, notamment parce que des patients peuvent ne jamais récidiver ou présenter de nouveaux symptômes d'une maladie. Ces individus sont considérés comme « guéris » ou « immuns », et leur temps jusqu'à la survenue de l'évènement est alors infini. Ainsi, des modèles spécifiques appelé modèles de guérison (cure models) ont été proposés. Les premiers travaux remontent à Boag (1949) et Berkson et Gage (1952), mais c'est à partir des propositions de Farewell (1977, 1982) que la forme actuelle de ces modèles a vu le jour. De nombreuses propositions et extensions ont été faites (voir Amico et Van Keilegom, 2018). La plus-value de ces méthodes est qu'elles permettent d'estimer deux quantités : la fonction de survie des non-guéris et la proportion de guérison et d'évaluer l'effet de différentes caractéristiques sur ces quantités. L'application de ces modèles en recherche clinique se concentre principalement en oncologie (Filleron et al. (2021), Botta et al. (2022)). Cependant, avec l'amélioration des prises en charge, la guérison est de plus en plus probable, et l'utilisation de ces méthodes semblent pertinentes dans de nombreuses autres disciplines médicales. Notamment, dans le cas de l'asthme, les nouveaux traitements par biothérapies permettent la rémission (Weschler et al. (2024)). Il semble dès lors pertinent d'utiliser des modèles de guérison plutôt que des méthodes classiques pour étudier des durées de vie dans le domaine médical.

Les modèles de guérison reposent sur une décomposition probabiliste de la population en deux sous-groupes latents : les individus immunisés (ou guéris) et les non-immunisés, modélisée via une variable de mélange. L'objectif est double : d'une part, estimer la probabilité d'appartenance au groupe des patients immunisés, ainsi que les facteurs explicatifs associés ; d'autre part, caractériser la distribution de survie des patients non-immunisés et identifier les déterminants influençant leur risque d'événement. Dans la littérature, ces modèles de mélange (mixture cure models) reposent sur une décomposition explicite de la population en une fraction guérie et une fraction non-guérie, avec une modélisation paramétrique ou semi-paramétrique de la survie conditionnelle des individus non-immunisés. La majorité des travaux existants s'appuie sur des hypothèses paramétriques ou sur des modèles semi-paramétriques de type Cox (Amico & van Keilegom (2018), van Keilegom & Patilea (2020)). Néanmoins, des approches non-paramétriques, notamment par des estimateurs à noyaux, ont été proposées afin d'estimer la fonction de survie et la fraction guérie sans hypothèses fortes, offrant une plus grande flexibilité et une meilleure robustesse face à la complexité et à l'hétérogénéité des données cliniques, cf. Lopez-Cheda et al. (2017), Lopez-Cheda et al. (2023).

1.Développement de nouveaux estimateurs par projection dans les cure models
Le premier objectif de la thèse est de développer une nouvelle méthode d'estimation, basée sur la projection de la fonction de risque instantané, dans le cadre des modèles de guérison. Le coeur du projet consistera à adapter un contraste de projection spécifique à ce contexte. L'étude portera à la fois sur les estimateurs simples et sur ceux intégrant des covariables, avec une analyse approfondie de leurs propriétés statistiques. Ces estimateurs par projection offrent une inférence flexible, guidée par les données, et présentent des propriétés d'optimalité dans divers contextes, Plancade (2011) et Brunel & Comte (2021).
2.Extension d'indicateurs d'inférence causale au cas des cure models
Le projet intégrera également une approche d'inférence causale afin d'évaluer l'effet de stratégies thérapeutiques sur la survie des patients, au-delà des associations observées. L'effet du traitement sera quantifié à l'aide du Restricted Mean Survival Time (RMST) (Royston & Parmar (2013)), un indicateur clinique interprétable correspondant au temps de survie moyen restreint sur un horizon donné. Contrairement aux mesures de risque classiques, la RMST permet une comparaison directe et intuitive des bénéfices cliniques entre groupes.
3.Application clinique : caractérisations des patients en rémission de l'asthme sévère.
Le nouvel estimateur sera ensuite implémenté et appliqué à la fois sur des données simulées et sur des données réelles de patients asthmatiques présents dans les deux cohortes nationales COBRA, Zysman et al. (2024) et RAMSES, Perotin et al. (2023). Les performances empiriques seront évaluées et comparées aux approches existantes issues de la littérature.
Le projet s'appuiera sur une collaboration avec l'Institut Debrest d'Epidémiologie et de Santé Publique (IDESP) avec Maïlis Amico, co-encadrante de la thèse, qui apportera son expertise d'une part sur les modèles de guérison, ainsi que sur les deux cohortes COBRA et RAMSES. L'équipe de pneumologues du Pr. Arnaud Bourdin, PhyMedEXP, UMR INSERM 1046 apportera aussi son expertise sur l'application clinique, avec en particulier la collaboration du Dr Engi Ahmed.

Je postule sur HelloWork

Offres similaires

Consultant Innovation H/F

  • In Extenso

  • Montpellier - 34

  • CDI

  • 3 Avril 2026

Garde Enfant à Domicile H/F

  • SORIA PRESTATIONS

  • Montpellier - 34

  • CDI

  • 3 Avril 2026

Déposez votre CV

Soyez visible par les entreprises qui recrutent à Montpellier.

J'y vais !

Chiffres clés de l'emploi à Montpellier

  • Taux de chomage : 14%
  • Population : 295542
  • Médiane niveau de vie : 18870€/an
  • Demandeurs d'emploi : 39020
  • Actifs : 134890
  • Nombres d'entreprises : 30684

Sources :


Un site du réseaux :

Logo HelloWork