Travailler chez Substra

Description

Substra Foundation promeut des approches du machine learning et de l'IA protectrices des données personnelles et des données sensibles en général. Elle coordonne un projet open source nommé Substra. Substra permet l'orchestration décentralisée et trustless de tâches de machine learning, fournit une traçabilité complète et garantit la confidentialité des données.

Substra Foundation se donne notamment pour objectif de fédérer et animer une communauté active de contributeurs et d'utilisateurs du framework Substra. Le premier contributeur et partenaire-clé de Substra Foundation est Owkin, une start-up spécialisée en machine learning dans le domaine médicale, qui dédie une équipe technique au développement de la première version de Substra qui sera publiée au 2nd semestre 2019 sous licence Apache 2.0.

Notre équipe

À la petite équipe polyvalente et entrepreneuriale de Substra Foundation s'ajoutent les contributeurs à l'initiative open source Substra, dont plusieurs sont engagés à plein temps. C'est donc une équipe en plusieurs cercles concentriques, qui se nourrit des cultures des différentes organisations partenaires.

Notre vision

AI is promising but...
AI is making tremendous progresses, creating vast transformation and innovation opportunities in all sectors. One prerequisite of AI technologies is the collection of data and its processing into exploitable datasets. Storage, processing and sharing of huge amounts of information may constitute a considerable threat to data privacy, governance and valorization, and public and private awareness is raising as illustrated by the growing fear of value appropriation by private tech giants, or by the recent enforcement of GDPR in Europe. These threats are even more acute when the underlying data in a machine learning ecosystem is sensitive, either by its personal or confidential nature.

Trustless, traceable, privacy-preserving ML orchestration
At Substra Foundation we believe in and advocate for a model where data providers retain full control of their data, while these data are unlocked, in privacy-preserving conditions, for concrete and impactful ML projects.
Substra  is a software framework building upon the leading private and permissioned blockchain framework Hyperledger Fabric. It offers by-design trustless, traceable, privacy-preserving machine learning orchestration among multiple parties.
Data analysis algorithms travel to distributed training dataset nodes, and computations are performed on local, disposable, secure computing containers at each node. The trustless nature of the distributed ledger framework enforces the preservation of data privacy and provides an incorruptible traceability of all operations.
It enables multi-party data analysis and machine learning collaborations, it facilitates a large variety of strategies for privacy-preserving data sharing.