Data Scientist: building and valorizing a large-scale cohort of diabetic patients F/H

Paris 13Autres métiersAutres métiersHôpital Pitié-Salpêtrière - 75 Paris 13CDD uniquement

Description du poste

Métier
Autres métiers
Type de contrat
CDD uniquement
Rémunération
40 à 55k€ (selon expérience, profil)
Service d'affectation
CEPHEPI
Présentation du service

Le projet CODIA est un projet interdisciplinaire à l’intersection de la médecine (diabétologie), de la pharmaco-épidémiologie (CEPHEPI, https://pitiesalpetriere.aphp.fr/centre-pharmacoepidemiologie-cephepi/) et de la science des données (équipe Inria Soda https://team.inria.fr/soda/) afin d’améliorer la prise en charge du diabète via la réutilisation secondaire des données de santé. Nous travaillons plus particulièrement sur l’Entrepôt de Données de Santé (EDS) de l’AP-HP. L’EDS est une base de données qui héberge les dossiers médicaux informatisés de plus de 19 millions de patients suivis dans les 38 hôpitaux de l’AP-HP. Ces données peuvent être structurées (codes diagnostiques de pathologie, traitements administrés, procédures, biologies hospitalières, démographie, etc.) ou non structurées (comptes rendus d’hospitalisation, prescriptions, notes de consultation, etc.). CODIA vise à construire une COhorte de l’ensemble des patients DIAbétiques [1], afin de pouvoir ensuite l’utiliser pour différents projets de recherche, portant par exemple sur le rôle de l’inflammation dans le diabète (https://intercept-t2d.eu/) [2], l’apparition et la gestion de complications du diabète, comme le pied diabétique [3], la maladie rénale chronique, et l’évaluation de l’efficacité de traitements en vie réelle. Nous avons maintenant consolidé une base de données de près de 650 000 patients, ce qui en fait l’une des plus larges cohortes de patients diabétiques d’Europe.

Vos missions

Encadrement

- Judith Abécassis, Soda team, Inria Saclay (judith.abecassis@inria.fr)

- Candice Estellat, CEPHEPI, Pitié-Salpêtrière, APHP (candice.estellat@aphp.fr)

- Louis Potier, PUPH, Hôpital Bichat, AP-HP (louis.potier@aphp.fr)

En tant que data scientist sur ce projet, vous travaillerez en relation étroite avec les différents acteurs du projet afin de

- Cibler les bonnes données, au bon moment : sélectionner et préparer des sous-cohortes adaptées aux enjeux cliniques des projets

- Piloter des analyses data innovantes : dans une démarche d’inférence causale, allier biostatistiques, épidémiologie et, quand c’est pertinent, machine learning, avec l’appui des experts du consortium

- Faire parler les données cachées : poursuivre l’application de stratégies de traitement automatique des langues pour enrichir et fiabiliser l’information extraite des notes cliniques non structurées

- Partager les avancées : contribuer activement à la rédaction d’articles scientifiques afin de diffuser les résultats auprès de communautés variées

Pour maximiser la synergie des expertises du consortium, vous serez basé·e au centre de pharmaco-épidémiologie de la Pitié-Salpêtrière, tout en collaborant activement avec :

● l’équipe Soda à Inria Saclay,

● les data scientists de l’AP-HP sur le campus Picpus (12e).

Ces échanges réguliers en présentiel garantiront l’accès à toutes les compétences clés nécessaires pour mener à bien le projet.

Profil recherché

Le/la candidat-e idéal-e dispose
- d'un M2 en mathématiques, informatique, sciences des données, biostatistiques ou équivalent
- d'une première expérience en data science / machine learning
- de bonnes connaissances en Python, SQL, Spark, des bonnes pratiques de développement, et d'une appétence pour les approches élégantes
- d'une excellente capacité à communiquer, et faire le lien entre les différentes équipes
- d'une bonne organisation, pour mener en parallèle plusieurs projets à des rythmes variés
- un intérêt marqué pour la santé publique

Note importante : nous recrutons des personnes pas des postes
Si après la lecture de cette description de poste, vous pensez que vous n'avez pas tous les prérequis mais qu'elle correspond à là où vous voudriez être dans votre prochaine position, nous vous encourageons à postuler !

Schéma horaire
Jour
Temps de travail
Administratif - Forfait
Horaires de travail
- Forfait jour
Télétravail
Oui

Description de l'hôpital
L'Assistance publique-Hôpitaux de Paris (AP-HP) est un centre hospitalier universitaire à dimension européenne mondialement reconnu.
Ses 38 hôpitaux accueillent chaque année 10 millions de personnes malades : en consultation, en urgence, lors d'hospitalisations programmées ou en hospitalisation à domicile.
Elle assure un service public de santé pour tous, 24h/24, et c'est pour elle à la fois un devoir et une fierté.
L'AP-HP est le premier employeur d'Ile-de-France : 100 000 personnes – médecins, chercheurs, paramédicaux, personnels administratifs et ouvriers – y travaillent.
Au cœur de l'Institution, le Siège de l'AP-HP rassemble sous un même périmètre les directions fonctionnelles et les établissements qui lui sont rattachés :
CFDC (Centres de Formation et de Développement des Compétences), ACHAT (Achat Centraux Hôteliers Alimentaires et Techniques),
DRCI (Département de la Recherche Clinique et de l'Innovation) et DSN (Direction des Services numériques).
Avec ses 4000 collaborateurs, le Siège assure un rôle d'expert, de pilote et de coordinateur pour l'ensemble des hôpitaux.
Engagée dans des projets novateurs et stratégiques au service des patients, l'AP-HP recherche aujourd'hui de nouveaux talents pour mener à bien sa mission.
Vous êtes l'un d'eux ? Venez nous rejoindre !
Référence de l'offre
2026-20001