
Et si nous pouvions utiliser l’intelligence artificielle pour démêler tous les détails moléculaires complexes des réactions chimiques, explorer des voies de réaction distinctes, révéler la participation des molécules de solvant et prendre en compte toutes les nuances d’effets thermodynamiques ? C’est le tour de force qu’ont réalisé des chercheurs du laboratoire PASTEUR (CNRS/ENS Paris/Paris Sciences et Lettres/Sorbonne Université) dans deux publications sorties dans les Proceedings of the National Academy of Sciences USA et le Journal of the American Chemical Society. En proposant une méthode systématique pour entraîner des neurones artificiels capables de s’affranchir des limitations actuelles des simulations moléculaires au niveau quantique, ils ont jeté un œil nouveau sur deux réactions cruciales de la chimie prébiotique, à l’origine de la synthèse des protéines et des acides nucléiques. En identifiant les mécanismes les plus favorables pour ces deux réactions, qui échappaient encore à l’expérience, ces résultats ouvrent la voie à la compréhension de la façon dont ces réactions ont pu se produire dans un contexte où les catalyseurs du vivant (les enzymes) n’existaient pas encore.
Les réactions chimiques sont des événements rares dans la vie des molécules. Observer comment les molécules réagissent est un défi expérimental ; même avec un microscope géant, nous passerions la majeure partie de votre temps à attendre qu’elles réagissent, et quand elles le font, cela se produit si rapidement que nous le manquerions. C’est là que les simulations entrent en jeu: elles permettent de suivre ces événements fugaces à notre guise. Mais elles rencontrent deux problèmes. Premièrement, suivre des événements réactifs signifie résoudre l’équation de Schrödinger des milliers de fois, ce qui est notoirement difficile. Deuxièmement, même après un effort de calcul aussi immense, nous n’aurions qu’une poignée d’observations. Mais la physique statistique nous enseigne que les systèmes atomistiques sont probabilistes, et des centaines d’observations sont nécessaires pour obtenir une image correcte et des quantités thermodynamiquement significatives.
Dans deux études séparées à la méthodologie voisine, les chimistes de l’ENS ont utilisé une approche d’intelligence artificielle émergente pour surmonter ces limitations. L’idée est d’entraîner un réseau de neurones à résoudre l’équation de Schrödinger pour toutes les structures possibles rencontrées lors d’une réaction chimique donnée. Un élément critique pour le succès de la démarche est la curation des données, pour laquelle ils ont proposé une méthode standardisée et robuste. Le résultat ? Une approche qui comble le fossé entre les mondes de la physique quantique et de la physique statistique à un coût de calcul modeste (et donc une empreinte carbone faible). Le meilleur des deux mondes !
Ces travaux ouvrent la voie à une modélisation beaucoup plus abordable des réactions chimiques en phase condensée, et à un changement de paradigme quant à la complémentarité qu’elles peuvent apporter aux résultats expérimentaux parfois difficiles à obtenir. Appliquée à deux réactions fondamentales de la synthèse des protéines d’une part (la liaison peptidique) et des acides nucléiques d’autre part (la liaison phosphoester), cette méthode a permis de mettre en évidence les voies de réaction les plus favorables pour ces deux réactions, ce que ne permettaient pas directement les études expérimentales. Ces résultats s’affichent comme une première étape vers la compréhension des conditions physico-chimiques optimales pour ces réactions énergétiquement très défavorisées et très peu probables qui ont mené à la formation des premières briques élémentaires du vivant il y a un peu plus de quatre milliards d’années.
Références :
Prebiotic chemical reactivity in solution with quantum accuracy and microsecond sampling using neural network potentials, Z. Benayad, R. David, G. Stirnemann, Proceedings of the National Academy of Sciences 121, e2322040121 (2024)
Competing reaction mechanisms of peptide bond formation in water revealed by deep potential molecular dynamics and path sampling, R. David, I. Tuñón, D. Laage, Journal of the American Chemical Society 146, 14213-14224 (2024)
Contacts :
Guillaume Stirnemann – guillaume.stirnemann@ens.psl.eu
Damien Laage – damien.laage@ens.psl.eu
Département de Chimie, UMR 8640 PASTEUR, École normale supérieure, Paris