Skip to main content

7 Mar, 2024

Le MIT et IBM trouvent des moyens astucieux de contourner les mathématiques brutales pour l’IA

Le MIT et IBM trouvent des moyens astucieux de contourner les mathématiques brutales pour l’IA

La technique pourrait réduire considérablement les besoins en données d’apprentissage de l’IA

Depuis l’époque d’Isaac Newton, les lois fondamentales de la nature se réduisent toutes à un vaste ensemble d’équations vitales. Aujourd’hui, des chercheurs ont trouvé un nouveau moyen d’utiliser des réseaux neuronaux inspirés par le cerveau pour résoudre ces équations de manière beaucoup plus efficace qu’auparavant, et ce pour de nombreuses applications potentielles dans les domaines de la science et de l’ingénierie.

Dans les sciences et l’ingénierie modernes, les équations aux dérivées partielles aident à modéliser des systèmes physiques complexes impliquant des taux de changement multiples, tels que ceux qui changent à la fois dans l’espace et dans le temps. Elles peuvent aider à modéliser toutes sortes de choses, telles que l’écoulement de l’air sur les ailes d’un avion, la propagation d’un polluant dans l’air ou l’effondrement d’une étoile dans un trou noir.

Pour résoudre ces équations difficiles, les scientifiques utilisent traditionnellement des méthodes numériques de haute précision. Cependant, ces méthodes peuvent prendre beaucoup de temps et nécessiter des ressources informatiques considérables.

Il existe actuellement des alternatives plus simples, connues sous le nom de modèles de substitution basés sur des données (data-driven surrogate models). Ces modèles, qui comprennent des réseaux neuronaux, sont entraînés sur des données provenant de solveurs numériques afin de prédire les réponses qu’ils pourraient produire.

Cependant, ces modèles nécessitent toujours une grande quantité de données provenant de solveurs numériques pour l’entraînement. La quantité de données nécessaires augmente de manière exponentielle à mesure que la taille de ces modèles augmente, ce qui rend cette stratégie difficilement extensible, explique l’auteur principal de l’étude, Raphaël Pestourie, chercheur en informatique au Georgia Institute of Technology d’Atlanta.

Dans une nouvelle étude, les chercheurs ont mis au point une approche pour développer des modèles de substitution. Cette stratégie utilise des simulateurs de physique pour aider à former des réseaux neuronaux afin qu’ils correspondent aux résultats des systèmes numériques de haute précision.

L’objectif est de générer des résultats précis à l’aide des connaissances d’experts dans un domaine – en l’occurrence, la physique – au lieu de se contenter de consacrer beaucoup de ressources informatiques à ces problèmes pour trouver des solutions par la force brute.

Les chercheurs ont découvert que les substituts numériques (symbolisés ici par une caricature de James Clerk Maxwell) peuvent trouver des solutions à des problèmes mathématiques difficiles qui nécessitaient auparavant des mathématiques de haute précision et de force brute (symbolisées par le daguerréotype de Maxwell).

Les scientifiques ont testé ce qu’ils ont appelé des modèles de substituts profonds améliorés par la physique (PEDS : physics-enhanced deep surrogate) sur trois types de systèmes physiques. Il s’agit de la diffusion, par exemple d’un colorant qui se répand dans un liquide au fil du temps, de la réaction-diffusion, par exemple de la diffusion qui peut se produire à la suite d’une réaction chimique, et de la diffusion électromagnétique.

Les chercheurs ont constaté que ces nouveaux modèles peuvent être jusqu’à trois fois plus précis que d’autres réseaux neuronaux pour traiter les équations différentielles partielles. Dans le même temps, ces modèles ne nécessitent qu’environ 1 000 points d’entraînement. Cela réduit d’au moins un facteur 100 les données de formation nécessaires pour atteindre une erreur cible de 5 %.

« L’idée est assez intuitive : laisser les réseaux neuronaux faire l’apprentissage et le modèle scientifique faire la science », explique Raphaël Pestourie. « PEDS montre que la combinaison des deux est bien supérieure à la somme des parties.

Les applications potentielles des modèles PEDS comprennent l’accélération des simulations « de systèmes complexes qui apparaissent partout dans l’ingénierie – prévisions météorologiques, capture du carbone et réacteurs nucléaires, pour n’en citer que quelques-uns », précise Raphaël Pestourie.

https://spectrum.ieee.org/mathematical-model-ai

https://www.nature.com/articles/s42256-023-00761-y