Data scientist spécialisé.e en développement logiciel F/H

Paris 12Informatique & NumériqueExpertise SI - Réseaux télécom & système - Infrastructure - DataSiège de l'AP-HP - 75 Paris 12Titulaire ou CDD

Description du poste

Métier
Expertise SI - Réseaux télécom & système - Infrastructure - Data
Type de contrat
Titulaire ou CDD
Présentation du service

La Direction des Services Numériques (DSN) de l’AP-HP fournit des services numériques sécurisés aux professionnels et patients. Elle développe et gère plusieurs centaines de solutions, dont le dossier patient, la biologie, l’imagerie, l’espace patient et la gestion hospitalière, sur 70 000 postes. Elle administre ses infrastructures (réseau, data centers, téléphonie, wifi) et favorise la réutilisation des données de santé.

L’équipe science des données a pour objectif de faciliter l’exploitation des données de l’Entrepôt de Données de Santé (EDS) (plus de 20 millions de patients, 190 millions de dossiers médicaux, 140 millions de diagnostics, 1 300 millions de résultats de laboratoires). Les missions de l’équipe s’organisent autour de quatre axes principaux :

1. Développement de modèles et outils basés sur l’EDS et impliquant une expertise en machine learning / deep learning et sur les données (ex : EDS-NLP, EDS Pseudo) ;

2. Structuration des données de l’EDS, afin d’enrichir les données médicales exploitables, et faciliter de nombreux projets de recherche clinique ;

3. Déploiement de produits basés sur des modèles de NLP (Natural Language Processing) et notamment des LLM (Large Language Model), pour être utilisés dans différents services (médicaux ou non) au sein de l’AP-HP ;

4. Animation d’un réseau autour de la science des données, et accompagnement de projets de recherche en santé mobilisant l’EDS.

L’équipe sciences des données est composée de onze professionnels.

Vos missions

Au sein de l’équipe data science, vous aurez pour mission de développer, valider et maintenir des algorithmes et bibliothèques logicielles scientifiques facilitant l’exploitation des données issues de l’EDS à des fins de recherche et de pilotage. Vous pourrez notamment vous concentrer sur l’analyse et le traitement automatique du langage permettant de transformer les données textuelles de l’EDS (en particulier les données d’oncologie) en données structurées directement exploitables. Ces travaux se font en étroite collaboration avec les experts métier au travers de groupes de travail.

En fonction des priorités de l’équipe, des travaux en lien avec le traitement des images, le traitement des séries temporelles, ou avec le déploiement, le maintien et l’évaluation de modèles en production pourront vous être demandés. Une expérience professionnelle dans l’un de ces domaines d’expertise ou en rapport avec les briques technologiques mobilisées (PyTorch, Polars, Spark, etc.) serait utile même si non indispensable.

MISSIONS GÉNÉRALES

·Développement et maintien d’une expertise dans le traitement des données médicales de l’EDS, notamment des données d’oncologie ;

·Développement, validation et maintenance de bibliothèques logicielles scientifiques écrites en Python facilitant l’analyse des données de l’EDS ;

·Développement de modèles de ML (Machine Learning), deep learning et NLP (Natural Language Processing) pour pré-traiter les données ;

·Rédaction la documentation technique ainsi que la documentation utilisateur ;

·Contribution à l’écriture d’articles scientifiques.

Profil recherché

Diplôme : Diplôme d’ingénieur avec spécialisation sur les enjeux de traitement de données massives ;
Niveau d’étude : Bac +5

Niveau d’expérience :
• Au moins 4 années d’expérience dans le domaine de la science des données
• Une expérience dans le domaine de la santé recommandée.

Compétences requises :
o Expertise en développement Python ;
o Expertise en développement de modèles de machine learning (PyTorch, Transformers, Scikit-learn, etc.) ;
o Expertise en déploiement de modèles statistiques/de machine learning.
o Expertise en traitement automatiques des langues (NLP) ;
o Expertise en analyse de bases de données (SQL) ;
o Expertise en calcul distribué et en data management (Spark, etc.) ;
o Expertise sur les données médicales ;

Compétences associées :
o Capacité à lire la littérature scientifique et à contribuer à des articles scientifiques ;
o Connaissance du RGPD et de la réglementation liée à la recherche sur données et la recherche clinique.

Savoir-faire et savoir être :
• Esprit d’équipe et fort sens du relationnel ;
• Autonomie, rigueur, méthode ;
• Excellentes aptitudes relationnelles et à la communication, capacité d’écoute et de vulgarisation, capacité de formation (Aisance à l’oral, diplomatie) ;
• Capacité de travail importante, associée à un fort dynamisme ;
• Curiosité et capacité d’adaptation et d’anticipation ;
• Adhésion aux valeurs du service public et intérêt prononcé pour le domaine de la santé.

Schéma horaire
Jour
Temps de travail
Administratif - Forfait
Télétravail
Oui
Vos avantages à l'AP-HP

Possibilité de télétravail si le poste le permet ;

Remboursement partiel des transports en commun (75%) et/ou forfait mobilité ;

Accès au restaurant du personnel à tarifs avantageux ;

Un centre formation et de développement des compétences interne pour les formations management, les renforcement Métiers… ;

19 jours de RTT, en plus des 25 jours de congés ;

Une offre de sorties culturelles, de voyages, de centres de vacances pour les titulaires et CDD sur poste permanent (AGOSPAP), des réductions et des bons plans (HOPTISOINS) ;

Pour les enfants, crèches internes, voyages culturels, séjours linguistiques et possibilité de bénéficier du supplément familial de traitement.


Description de l'hôpital
L'Assistance publique-Hôpitaux de Paris (AP-HP) est un centre hospitalier universitaire à dimension européenne mondialement reconnu.
Ses 38 hôpitaux accueillent chaque année 10 millions de personnes malades : en consultation, en urgence, lors d'hospitalisations programmées ou en hospitalisation à domicile.
Elle assure un service public de santé pour tous, 24h/24, et c'est pour elle à la fois un devoir et une fierté.
L'AP-HP est le premier employeur d'Ile-de-France : 100 000 personnes – médecins, chercheurs, paramédicaux, personnels administratifs et ouvriers – y travaillent.
Au cœur de l'Institution, le Siège de l'AP-HP rassemble sous un même périmètre les directions fonctionnelles et les établissements qui lui sont rattachés :
CFDC (Centres de Formation et de Développement des Compétences), ACHAT (Achat Centraux Hôteliers Alimentaires et Techniques),
DRCI (Département de la Recherche Clinique et de l'Innovation) et DSN (Direction des Services numériques).
Avec ses 4000 collaborateurs, le Siège assure un rôle d'expert, de pilote et de coordinateur pour l'ensemble des hôpitaux.
Engagée dans des projets novateurs et stratégiques au service des patients, l'AP-HP recherche aujourd'hui de nouveaux talents pour mener à bien sa mission.
Vous êtes l'un d'eux ? Venez nous rejoindre !
Référence de l'offre
2026-22629