
Avec 49 sites et 28.000 collaborateurs, notre client constitue la première entreprise pharmaceutique française. Il est aussi la première entreprise de recherche et développement en France, avec un budget de 1,9 milliard d’euros en R&D.
Contexte & Enjeux
Notre client souhaite créer un écosystème applicatif pour gérer des données cliniques en flux continu de manière sécurisée.
Les principaux objectifs du projet sont :
- Mettre en place une architecture scalable pour ingérer une quantité croissante de données
- Permettre aux Data Scientists de créer facilement des environnements sécurisés
- Assurer une architecture conforme aux normes de sécurité, juridiques et légales (traçabilité, anonymisation, RGPD, confidentialité, etc.)
- Rationaliser et réduire les coûts & délais à la fois lors de la phase de construction et d’exploitation
Notre approche
Différentes solutions ont été mises en place par TeamWork afin de répondre aux enjeux client :
- Création d’un réseau autonome et sécurisé grâce à la mise en place d’une DMZ ( zone tampon) et d’entrepôts de données indépendants
- Utilisation d’AWS Translate et d’AWS Comprehend pour la construction d’un pipeline de scraping et d’ingestion de données en temps réel, sans stockage intermédiaire
- Utilisation d’AWS Service Catalogue pour une utilisation métier contrôlée et simplifiée
Les solutions :
- AWS Service Catalog
- AWS SageMaker
- AWS Comprehend
- AWS Translate
Bénéfices
Le client a bénéficié d’une diminution significative des budgets, délais et ressources nécessaires au projet. Ainsi que d’une mise en place d’un pipeline d’ingestion Big Data hautement disponible et scalable.
Mais également d’une sécurisation maximale répondant à de fortes exigences légales, de provisionnement à la demande d’environnements de travail performants et à coûts réduits, puis d’une mise en œuvre d’un catalogue de services spécifiques et standardisés dédié aux Data Scientists.