Aeneas, une intelligence artificielle développée par Google DeepMind et portant le nom de l’héros troien ayant débarqué dans la région du Latium, se montre capable de recréer les passages manquants dans les inscriptions anciennes et de leur donner une datation précise.
Une IA co-créée par Google DeepMind, nommée Aeneas, pourrait devenir un allié précieux pour les historiens et les archéologues dans la reconstitution des écrits antiques en latin. Conçue pour analyser des textes et des images de dizaines de milliers de gravures sur pierre issues de différentes régions et époques de l’histoire romaine, cette technologie peut compléter les lettres et les mots disparus dans des fragments endommagés et même proposer des hypothèses sur le lieu et la période auxquels le texte a été écrit, en se basant sur les variations linguistiques régionales et temporelles. Ses capacités ont été détaillées dans un article publié dans la revue Nature.
Les énigmes antiques
Théa Sommerschield, historienne et spécialiste en épigraphie de l’Université de Nottingham au Royaume-Uni, a imaginé et mis en œuvre, en collaboration avec la technologie d’IA de Google DeepMind à Londres, ainsi qu’avec d’autres chercheurs experts en langues anciennes, un système destiné à faciliter le travail ardent de reconstruction des inscriptions en latin endommagées.
Comparer des fragments d’épigraphes (les inscriptions gravées dans la pierre) manquants avec d’autres, est une tâche minutieuse, car la langue évolue avec le temps et diffère selon les régions. De plus, chaque jour, de nouvelles inscriptions sont découvertes – un volume si conséquent qu’il dépasse la capacité de mémoire d’un seul individu.
Apprendre avec les classiques
Ce groupe de chercheurs a développé une IA générative, c’est-à-dire capable de créer du contenu original sur la base de ce qu’elle a appris, entraînée à partir de 176 861 inscriptions issues des trois plus grands bases de données d’épigraphes en latin, auxquelles s’ajoutent des photographies représentant 5 % de ces mêmes inscriptions. Ces textes s’étendent du VIIe siècle av. J.-C. au VIIIe siècle ap. J.-C.
Le modèle, baptisé Aeneas, en référence à l’épopée troienne et à l’héros ayant trouvé refuge dans le Latium avant de fonder la lignée de Rome, repose sur trois réseaux neuronaux (des algorithmes d’apprentissage automatique inspirés de la structure du cerveau humain), chacun dédié à une tâche spécifique : reconstituer les segments manquants, déterminer où le texte a été écrit et estimer son ancienneté.
>Des résultats impressionnants
L’IA a réussi à restaurer le texte disparu, tout en estimant la date de rédaction des inscriptions avec une précision allant jusqu’à 13 ans, lorsqu’elle a été testée sur des exemplaires dont la datation était connue. De plus, Aeneas a parfois identifié la province romaine où la pierre a été gravée, avec un taux de précision de 72 %.
Lors d’expériences sur des inscriptions latines volontairement altérées pour simuler les effets du temps, le système d’IA a atteint une précision de 73 % pour reconstituer des segments jusqu’à dix caractères de long. Elle a même réussi à restaurer des fragments dont la longueur totale était inconnue, avec une précision de 58 %.
>Une démarche concrète…
L’un des avantages majeurs pour les chercheurs est que le modèle affiche la liste des inscriptions similaires extraites de ses bases de données, classées par ordre de pertinence par rapport à la pièce à compléter.
Ce support permet de illustrer la raisonnement derrière ses suggestions et offre aux spécialistes la possibilité de vérifier la validité des propositions. Rechercher manuellement des matériaux similaires à celui à restaurer peut prendre des mois, voire des années. La rapidité de cette comparaison automatisée constitue ainsi un précieux outil, notamment pour les étudiants en épigraphie encore en formation.
Ce qui a permis à Aeneas de briller particulièrement, c’est sa collaboration étroite avec les archéologues et spécialistes : 23 épigraphistes ont ainsi obtenu de meilleurs résultats, aussi bien pour compléter que pour contextualiser les textes, lorsqu’ils ont utilisé l’IA.
En testant le modèle sur les Res gestae divi Augusti, “Les exploits du divin Auguste”, un document décrivant la vie de l’empereur, dont la datation avait longtemps fait l’objet de débats, Aeneas a atteint des conclusions chronologiques similaires à celles de la majorité des experts, sans se laisser tromper par les nombreuses datations contenues dans l’inscription.
La DeepMind a annoncé que Aeneas sera prochainement accessible en ligne à tous ceux qui souhaitent s’en servir.