IDEAL

IDEAL

Les données massives sont désormais présentes dans pratiquement tous les secteurs de la société et de l’économie. Leur gestion pose des défis scientifiques et techniques majeurs. Dans la plupart des projets actuels qui ont pour objectif l’analyse ou l’extraction de connaissances à partir des données, entre 70 à 80% du temps est consacré à la phase de collecte, de nettoyage, d’intégration et d’organisation des données.
Au cœur de l’explosion des données collectées, ce sont aujourd’hui plus de 20 milliards d’objets qui sont connectés à Internet (source : Strategy Analytics) et une estimation prévoit un parc mondial de 40 milliards d’appareils d'ici 20251.
Si le domaine des objets connectés, au cœur de cette remontée massive de données, permet de proposer des solutions dans de nombreux domaines de recherche, il est important que ces travaux prennent en compte leur propre coût énergétique. En effet, actuellement internet et ses infrastructures représentent déjà une consommation électrique équivalente à celle d’un état qui se situerait au sixième rang des pays consommateurs d’électricité. L’avènement annoncé et débuté des objets connectés devraient continuer à augmenter ce coût énergétique. Il est donc indispensable de réfléchir dès la conception de ces objets connectés à leur autonomie énergétique afin de ne pas alourdir trop fortement ce bilan. En cohérence avec ces enjeux et problématiques nationaux et internationaux, les travaux de recherche s’orientent ainsi vers l’amélioration énergétique des dispositifs de collecte des données. Dans ce contexte les cœurs de microprocesseur, dont la
consommation devrait encore chuter avec les nouvelles technologies à faible pertes (FDSOI et FINFET), permettront une fois embarqués dans des systèmes dédiés, de réaliser des objets communicants à très faible consommation nécessaires à l’essor de l’internet des objets.
Dans le même temps, la complexité des traitements liée à la quantité et la diversité des données alors remontées nécessitent de revisiter de manière profonde les fondamentaux en matière de gestion de données. L’intelligence artificielle, notamment au cœur du réseau de capteurs, apparaît aujourd’hui comme la solution la plus prometteuse à la fois pour les traitements de ces données mais également dans la gestion intelligente de la contrainte énergétique de ces réseaux d’objets connectés.
Le site clermontois a développé une expertise en conception de détecteurs ainsi que dans le domaine de la gestion et de l’analyse de données massives, en s’intéressant à la fois à des questions fondamentales mais aussi appliquées, en particulier dans le cadre de grands projets dans les domaines de l’environnement et de l’agriculture, de la santé et celui de la cosmologie/physique des particules.
Il est ainsi un des premiers sites universitaires en France sur lequel une plate-forme instrumentale de réseau de capteurs sans fil est déployée pour l’ensemble des acteurs. Développée notamment pour les besoins de surveillance des agroécosystèmes, elle propose une chaîne opérationnelle grâce à laquelle des nœuds communicants transmettent à l’aide d’un protocole de communication ouvert et sécurisé (LoRa) des données de capteurs de tous types jusqu’à un cloud hébergé au Mésocentre Clermont-Auvergne.
S’appuyant sur ces solides fondements, l’objectif du projet IDEAL est de maîtriser la chaîne complète de collecte et de traitement de données, du capteur à l’apprentissage automatique.

Le projet identifie quatre champs d’investigation :

  • L’intelligence distribuée. L’objectif est d’améliorer la fiabilité et l’efficacité des applications en déportant le traitement des données vers les objets connectés au sein d’infrastructures autoadaptables. L’enjeu est d’analyser la donnée au plus proche de sa source de production et de développer des approches d’apprentissage automatique pour des systèmes autonomes ou embarqués. Les verrous associés portent sur le développement d’architectures dynamiques et reconfigurables, basées sur des capteurs autonomes à faible consommation.
  • L’autonomie énergétique des objets connectés. L’objectif est de réaliser les dispositifs connectés à faibles consommation pouvant devenir autonomes grâce aux développements récents dans le domaine de la récupération d’énergie ambiante. Les solutions matérielles issues de ces recherches permettront un développement à large échelle et à coût énergétique réduit des outils de remonter des données en proposant les premiers nœuds intelligents communicants autoalimentés.
  • La gestion et l’analyse des données massives à grande échelle. De nouveaux paradigmes émergent autour de la distribution des données ou de la parallélisation massive dans le cadre de nouveaux modèles de calcul tandis que les enjeux de qualité de donnée et d’incertitude de mesure restent centraux. D’autres voies à explorer sont le développement de méthodes d’extraction de connaissances et de fouilles de données centrées sur l’utilisateur, l’exploitation de techniques de représentation des connaissances et du raisonnement pour développer de nouvelles approches sémantiques et l’interaction entre la gestion des données et l’apprentissage automatique. L’ensemble de ces enjeux doit intégrer l’optimisation énergétique des infrastructures et des logiciels.
  • L’apprentissage à partir de données de grande dimension. L’enjeu est d’étudier l’architecture de réseaux pour l’analyse de données capteurs denses et hétérogènes, pour le traitement d’images de très haute résolution, de séries temporelles, et pour l’apprentissage multimodal.
Objectifs du projet IDEAL
Objectifs du projet IDEAL © Vincent Breton

Ces développements seront mutualisés pour leur utilisation par les autres défis du site clermontois sur les infrastructures du mésocentre Clermont-Auvergne. Ils seront aussi intégrés à l’offre de services vers les autres acteurs de la région dans le cadre du projet CINAURA.

Contact

vincent.breton@clermont.in2p3.fr