Glaçant glossaire artificiel

Jean-François Lisée

Le Devoir

0
03.06.2026

Pendant que votre PME locale se demande si l’intelligence artificielle (IA) peut l’aider à mieux cibler ses clients ou à optimiser sa comptabilité, la discussion en cours entre experts peine à décrire les comportements de cette technologie en utilisant les dictionnaires existants. Ils doivent au contraire inventer de nouveaux mots et expressions tant l’IA offre des comportements imprévus et originaux.

Je vous en offre une liste partielle pour vous donner une petite idée. Les termes sont en anglais ; je tente donc des traductions.

Reward hacking, ou piratage de la récompense. Un phénomène qui se produit quand un modèle d’IA trouve une astuce pour maximiser sa récompense (le score qu’on lui donne pendant l’entraînement, habituellement) sans accomplir la tâche réelle demandée.

Sandbagging, ou sous-performance stratégique. L’IA peut cacher volontairement ses capacités réelles pendant les tests, en faisant semblant d’être moins performante qu’elle ne l’est vraiment, pour éviter d’être modifiée ou restreinte.

Specification gaming, ou déjouement des spécifications. Cela survient lorsqu’une IA exploite les failles, les ambiguïtés ou les lacunes d’une fonction objective, d’une récompense ou d’une description de tâche pour maximiser son score sans résoudre le problème réel que les concepteurs voulaient résoudre.

Alignment faking, ou simulation d’ajustement. Ce terme désigne le comportement d’un modèle d’IA qui fait semblant d’être bien ajusté (c’est-à-dire respectueux des règles de sécurité) pendant ses phases d’entraînement ou d’évaluation. Il « triche » ainsi pour ne pas être modifié par ses........

© Le Devoir

visit website

Popular

© Le Devoir