Diversitat lingüística en l’era de la intel·ligència artificial
15.03.2024 - 21:40
Actualització: 15.03.2024 - 21:41
Ara tot just fa un any, ChatGPT canviava el panorama tecnològic de manera radical. Aquest model d’intel·ligència artificial generativa (IAG) és capaç, tal com el nom indica, de generar text, imatges o altres menes de dades, com ara blocs de codi en un llenguatge de programació, a partir de comandes o instruccions d’un usuari. El que produeix el model és de tanta qualitat que sovint es fa difícil de saber, d’entrada, que no és fet per una persona. A vegades, però, al·lucina i pot proporcionar, per exemple, enllaços a pàgines web que cita com a font d’informació però que a l’hora de la veritat no existeixen. Aquesta alta qualitat ha fet saltar totes alarmes: en un moment en què sovint ja costava de saber quina informació era certa i quina no ho era, aquests continguts només poden empitjorar la desinformació actual. Però com funcionen aquests models realment?
A grans trets, els sistemes d’IAG són models probabilístics. Això vol dir que per generar text fan servir les probabilitats que dues o més paraules apareguin juntes segons les observacions que han fet en els materials d’aprenentatge. Aquests materials no deixen de ser grans bases de dades de textos en una llengua, o corpus lingüístics com els que s’elaboren fent treball de camp. La diferència és la mida: un corpus de l’anglès per a IAG pot tenir milions de paraules i el podem elaborar amb relativa facilitat tot pentinant internet i arreplegant-ne tot allò que hi trobem, tot i que aquí hi entren qüestions d’ètica i autoria. Com més dades tinguem, més “aprendrà” el nostre model. És........
© VilaWeb
visit website