Data Engineer (MLOPS) - Plateforme Données Massives AP-HP F/H

Détail de l'offre

Informations générales

Entité de rattachement du publieur

L'Assistance publique-Hôpitaux de Paris (AP-HP) est un centre hospitalier universitaire à dimension européenne mondialement reconnu.
Ses 38 hôpitaux accueillent chaque année 10 millions de personnes malades : en consultation, en urgence, lors d'hospitalisations programmées ou en hospitalisation à domicile.
Elle assure un service public de santé pour tous, 24h/24, et c'est pour elle à la fois un devoir et une fierté.
L'AP-HP est le premier employeur d'Ile-de-France : 100 000 personnes – médecins, chercheurs, paramédicaux, personnels administratifs et ouvriers – y travaillent.

Au cœur de l'Institution, le Siège de l'AP-HP rassemble sous un même périmètre les directions fonctionnelles et les établissements qui lui sont rattachés :
CFDC (Centres de Formation et de Développement des Compétences), ACHAT (Achat Centraux Hôteliers Alimentaires et Techniques),
DRCI (Département de la Recherche Clinique et de l'Innovation) et DSN (Direction des Services numériques).
Avec ses 4000 collaborateurs, le Siège assure un rôle d'expert, de pilote et de coordinateur pour l'ensemble des hôpitaux.

Engagée dans des projets novateurs et stratégiques au service des patients, l'AP-HP recherche aujourd'hui de nouveaux talents pour mener à bien sa mission.
Vous êtes l'un d'eux ? Venez nous rejoindre !
  

Date de parution

26/09/2024

Description du poste

Métier

Informatique & Numérique - Chefferie de Projet - MOA

Intitulé du poste

Data Engineer (MLOPS) - Plateforme Données Massives AP-HP F/H

Type de contrat

Titulaire ou CDI

Rémunération

46 000 - 72 000 brut annuel, selon profil

Télétravail

Oui

Présentation du service

La Direction des Services Numériques (DSN) de l’AP-HP fournit les services numériques de l’institution aux utilisateurs, qu’ils soient patients ou professionnels. Avec plusieurs centaines de services numériques, comme le dossier patient informatisé, les systèmes de biologie et d’imagerie, l'espace patient, elle gère ses infrastructures et plus de 500 professionnels qui œuvrent au quotidien pour la transformation numérique de l’institution.



Le pôle Innovation & données de la DSN, composé d’environ 120 personnes, propose une offre de services structurée autour de l’innovation numérique, l’entrepôt de données de santé de l’AP-HP, la bio-informatique et des maladies rares.



Zoom sur les données et l’EDS !


Les données collectées via le dossier patient informatisé permettent de constituer des bases de données pseudonymisées de grande envergure, ouvrant des perspectives pour la recherche en santé, l’innovation et le pilotage hospitalier.


L’AP-HP a été parmis les pionniers en créant en 2017 le premier entrepôt de données de santé (EDS) hospitalier autorisé par la CNIL, aujourd’hui le plus grand en Europe.


Pour renforcer son rôle et accélérer la recherche en santé grâce à son EDS, l’AP-HP a lancé le programme ACCES AP-HP, s’inscrivant dans la Stratégie d’accélération « Santé Numérique » du plan France 2030. Lauréate de l’appel à projet « Accompagnement et soutien à la constitution d’entrepôts de données de santé hospitaliers », l’AP-HP forme son équipe ACCES AP-HP !

Vos missions

Nous recherchons un.e ingénieur de la donnée (Data Engineer) passionné.e, avec une spécialisation en MLOps, pour rejoindre notre équipe dédiée à la conception, l'intégration et au déploiement des données massives au sein de l'Environnement de Données de Santé de l'AP-HP. Vous jouerez un rôle crucial pour garantir que les données sont sécurisées et optimisées pour divers projets de recherche, pilotage stratégique et aide à la décision au siège de l'AP-HP.


En tant qu’expert.e en MLOps, vous assurerez la robustesse, la reproductibilité et l’évolutivité des modèles de machine learning, en étroite collaboration avec l’équipe Data Science.


Vous interviendrez sur l’ensemble du cycle de vie des données, de leur ingestion à leur exploitation, tout en participant à l'industrialisation des processus sur notre infrastructure Kubernetes.


Votre quotidien sera rythmé par des missions variées, parmi lesquelles :


- Conception et développement de solutions de traitement de données : Concevoir et développer des pipelines complexes pour la collecte, la transformation, la standardisation, et le stockage des données, tout en tenant compte de leur typologie spécifique (imagerie, voix, signaux physiologiques, etc.).


- Intégration d'algorithmes ML/Deep Learning : Incorporer des algorithmes d’analyse avancés et des méthodes de Machine Learning/Deep Learning au sein des pipelines de données, en fonction des besoins des utilisateurs.


- Optimisation de la performance dans un contexte Big Data : Améliorer la performance des pipelines de traitement de données en pour gérer efficacement des volumes massifs de données.


- Sécurisation et conformité : Veiller à la sécurisation des outils et applications développés, en assurant la protection des données sensibles et le respect des réglementations en vigueur (pseudonymisation, RGPD, etc.).


- Maintenance opérationnelle : Assurer la disponibilité et la performance continue des outils développés, en mettant en place les outils nécessaires à leur maintenance en condition opérationnelle.


- Documentation technique et utilisateur : Rédiger et maintenir à jour la documentation technique ainsi que la documentation utilisateur pour garantir une compréhension et une utilisation optimale des solutions mises en place.


- Contribution à la communauté Open Source : Participer activement à l’animation de la communauté Open Source autour des projets développés (gestion des bugs, suggestions d’améliorations, pull requests, etc.).


- Conception d'outils d'annotation de données médicales : Collaborer à la création d'outils dédiés à l'annotation de données médicales pour soutenir l’entraînement de modèles ML/Deep Learning et favoriser l’émergence de l’intelligence artificielle au sein de l'AP-HP.


- Veille technologique et transfert de compétences : Assurer une veille technologique régulière pour rester à la pointe des innovations dans le domaine et diffuser ces connaissances au sein de l’équipe, renforçant ainsi notre expertise collective.

Profil recherché

Diplôme : École d’ingénieur, informatique, data science, ou domaine connexe. (Bac +5)
Niveau d’expérience : Minimum 5 ans d'expérience en tant que Data Engineer, avec une spécialisation en MLOps et une expérience significative dans des environnements Big Data.

Compétences requises :
- Développement logiciel : Très bonne maitrise des langages de programmation Python et Scala. Également des langages de “scripting” comme Bash.
- Gestion des pipelines de données : Capacité à concevoir, développer et optimiser des pipelines de traitement de données à grande échelle, en utilisant des technologies comme Apache Spark, Polars, ou équivalent.
- Infrastructure et DevOps : Expérience avec des environnements on-premise (et optionnellement Cloud) et des outils DevOps (Docker, Kubernetes, Terraform) pour le déploiement et la gestion des infrastructures.
- Gestion et exploitation des bases de données/des systèmes de stockage : Maîtrise des solutions de stockage et gestion des bases de données (Hive, Hbase, Solr, Kafka, PostgreSQL, S3, etc.), adaptées à des données structurées et non structurées. Très bonne maitrise également des langages associés comme SQL, Lucene, etc.
- Backend/API : Connaissance des architectures backends/API et des solutions associées comme Spring Boot, Fast API, etc.
- Intégration et déploiement de modèles ML/AI : Expérience dans l’intégration de modèles de machine learning et deep learning dans des pipelines de production, avec une attention particulière à la scalabilité et à l’optimisation. Maîtrise des concepts et outils MLOps, tels que CI/CD pour ML, déploiement de modèles, surveillance, et maintenance de pipelines ML.
- Sécurisation des données et conformité : Connaissance approfondie des meilleures pratiques de sécurisation des données, en conformité avec les réglementations en vigueur (notamment RGPD).
- Gestion de projet en méthodologie Agile : Expérience dans la gestion de projets utilisant des méthodologies Agile (Scrum, Kanban), incluant la planification des sprints, la gestion du backlog, l'animation des cérémonies Agile (daily stand-ups, rétrospectives, etc.), et la collaboration étroite avec les équipes pour garantir des livraisons incrémentales et de haute qualité.
- Documentation technique et fonctionnelle : Capacité à rédiger des documentations techniques claires et détaillées, ainsi que des guides utilisateurs, pour assurer une bonne compréhension et utilisation des outils développés.
- Veille technologique

Apprécié :

- Connaissance du standard d’interopérabilité HL7-FHIR et autres protocoles et standards en informatique de santé (HL7 v2, Dicom, etc.)
- Connaissances en administration d’environnements Linux
- Connaissance en statistiques
- Connaissance des bonnes pratiques de sécurité informatique
- Connaissance dans le domaine de la santé

Savoir-faire et savoir être :
- Autonomie
- Capacité à challenger
- Esprit collaboratif
- Orientation solution et service utilisateur
- Innovation et créativité

Horaires de travail

Forfait jours, 25 jours de congés et 19 jours de RTT

Les avantages de l'AP-HP

Vos avantages à l'AP-HP

- Possibilité de télétravail


- Remboursement partiel des transports en commun (75%) ou forfait mobilité


- Cotisation salariale avantageuse dans le secteur public (à salaire brut égal, le salaire net est plus élevé dans le secteur public que dans le secteur privé).


- Accès au restaurant du personnel à tarifs avantageux 


- Un centre formation et de développement des compétences interne pour les formations management, les renforcement Métiers…


- 19 jours de RTT, en plus des 25 jours de congés


- Une offre de sorties culturelles, de voyages, de centres de vacances pour les titulaires et CDD sur poste permanent (AGOSPAP), des réductions et des bons plans (HOPTISOINS)


- Pour les enfants, crèches internes, voyages culturels, séjours linguistiques et possibilité de bénéficier du supplément familial de traitement.

Localisation du poste

Localisation du poste

France, Ile-de-France, Paris (75)

Ville

Paris 12

Hôpital et/ou site

Direction des Services Numériques