Descobreixen una nova tècnica d’intel·ligència artificial que comprèn nous conceptes al mateix nivell que humans

  • Aquesta troballa pot servir per millorar les capacitats d’eines com ara el ChatGPT

VilaWeb
ACN
26.10.2023 - 11:56
Actualització: 07.11.2023 - 22:47

Investigadors de la Nova York University (NYU) i de la Universitat Pompeu Fabra (UPF) han creat una tècnica pionera que té el potencial de desenvolupar la generalització composicional en els sistemes computacionals al mateix nivell que en els éssers humans o, en alguns casos, fins i tot a un nivell superior. Aquest descobriment, que pot servir per millorar les capacitats d’eines d’intel·ligència artificial generativa com ara el ChatGPT, s’exposa en un article publicat per la revista Nature. Les persones poden aprendre un concepte nou i, una vegada adquirit, comprendre els diferents contextos i expressions en què es fa servir. Aquesta capacitat es denomina generalització composicional.

La tecnologia desenvolupada pels investigadors arriba després de prop de quatre dècades de treball de la comunitat científica per desenvolupar la capacitat de generalització composicional entre les màquines. A finals de la dècada de 1980, Jerry Fodor i Zenon Pylyshyn, filòsofs i científics cognitius, ja van plantejar que les xarxes neuronals artificials —els motors que impulsen la intel·ligència artificial i l’aprenentatge automàtic— no són capaços de fer aquestes connexions. Des de llavors, s’han desenvolupat diferents maneres d’incentivar aquesta capacitat en les xarxes neuronals i tecnologies afins, però amb resultats desiguals. Així doncs, avui dia, encara es manté viu el debat sobre com aconseguir-ho.

Amb aquesta troballa, els investigadors han demostrat que una xarxa neuronal genèrica pot imitar o superar la generalització sistemàtica humana en una comparació cara a cara. La nova tècnica, Meta-learning for Compositionality (MLC), parteix de mètodes d’entrenament diferents dels de la majoria d’eines actuals d’IA.

L’MLC se centra en l’entrenament de xarxes tecnològiques neuronals per millorar la generalització composicional dels sistemes computacionals a través de la pràctica. Els creadors dels sistemes existents fins avui, inclosos els models lingüístics usats per tecnologies d’IA generativa, partien del supòsit que la generalització composicional de les tecnologies sorgiria a partir de mètodes d’entrenament estàndard, o bé havien desenvolupat arquitectures especials per assolir que les màquines adquirissin aquestes capacitats. En canvi, l’MLC mostra que les màquines poden desenvolupar les habilitats de generalització composicional a partir de la pràctica explícita d’exercicis que l’ajudin a adquirir-la.

Per provar l’eficàcia de l’MLC, els investigadors han realitzat una sèrie d’experiments amb participants humans on els plantejaven tasques idèntiques a les realitzades pel sistema. A més, en lloc d’aprendre el significat de paraules reals —termes que les persones ja coneixerien—, van haver d’aprendre el significat de termes sense sentit, definits pels investigadors, i aprendre a aplicar-los de diferents maneres. El rendiment de l’MLC va ser tan bo, i en alguns casos millor, com el dels participants humans. Tant l’MLC com les persones també van superar el ChatGPT i el GPT-4, que, malgrat mostrar capacitats sorprenents en termes generals, van mostrar dificultats amb aquesta tasca d’aprenentatge vinculada a la generalització composicional.

Recomanem

La premsa lliure no la paga el govern. La paguem els lectors.

Fes-te de VilaWeb, fem-nos lliures.

Fer-me'n subscriptor
des de 75€ l'any
Fer-me'n subscriptor