Skip to main content

14 Mar, 2022

L’IA DeepMind de Google comble les lacunes de textes anciens incomplets

L’IA DeepMind de Google comble les lacunes de textes anciens incomplets

DeepMind a entraîné son IA à prédire les caractères manquants dans des textes anciens incomplets.

Du confinement du plasma pour la fusion nucléaire à la résolution de problèmes de repliement de protéines vieux de 50 ans, l’IA de DeepMind commence à faire ses preuves aux frontières de la science moderne. Afin de faciliter la recherche sur l’histoire de l’écriture humaine, l’entreprise a mis sa technologie au service de la restauration de textes anciens incomplets, ce qu’elle a fait avec un degré de précision impressionnant.

Au cours des cinq dernières années environ, nous avons vu la technologie d’IA de DeepMind faire des bonds impressionnants qui ont démontré son potentiel pratique et sa capacité à résoudre certains des problèmes les plus complexes de la science, comme ceux mentionnés ci-dessus. Parmi les autres exemples, citons l’amélioration de la précision des prévisions de pluie, la victoire sur les meilleurs joueurs de Go du monde et la réduction des coûts des centres de données de la société mère Google.

En se tournant vers l’histoire ancienne, DeepMind vise maintenant à apporter une nouvelle clarté aux inscriptions anciennes qui ont été endommagées, déplacées de leur emplacement d’origine ou qui ne peuvent être datées avec précision. Pour ce faire, les chercheurs de DeepMind ont fait équipe avec des historiens et des scientifiques en Italie, en Angleterre et en Grèce, et ont entraîné l’IA sur le plus grand ensemble de données numériques d’inscriptions grecques, en utilisant à la fois des caractères individuels et des mots complets comme entrées.

L’outil d’IA qui en résulte, que l’équipe a appelé Ithaque en référence à l’île grecque décrite dans l’Odyssée d’Homère, a été capable de restaurer des textes endommagés avec une précision de 62 %, d’identifier leur emplacement d’origine avec une précision de 71 % et de dater correctement les textes à 30 ans près de leur véritable date de création.

Lors d’expériences, les historiens experts ont obtenu une précision de 25 % lors de la restauration des textes anciens, mais en utilisant Ithaca, cette précision est passée à 72 %.

Comme Ithaca est conçu comme un outil de recherche, la version finale génère plusieurs hypothèses de prédiction de texte, parmi lesquelles les historiens peuvent ensuite choisir. Lorsqu’il s’agit d’identifier l’emplacement original d’un texte, au lieu d’une solution unique, il propose une carte avec une distribution de probabilités pour 84 régions anciennes différentes, et fait de même pour les années possibles lors de la datation d’un texte.

Lors d’expériences, des historiens experts ont obtenu une précision de 25 % lors de la restauration de textes anciens, mais en utilisant Ithaca, cette précision est passée à 72 %. L’espoir est que cette technologie puisse débloquer le potentiel des systèmes d’IA travaillant en coopération avec des experts humains, apportant une nouvelle clarté à notre compréhension des civilisations passées.

DeepMind indique qu’elle travaille déjà sur des versions formées à d’autres langues anciennes, comme l’hébreu, le démotique et le maya. DeepMind a rendu le code d’Ithaca open source et en a lancé une version interactive gratuite en ligne.

https://ithaca.deepmind.com/

https://www.nature.com/articles/s41586-022-04448-z

https://deepmind.com/blog/article/Predicting-the-past-with-Ithaca