Gemini, de Google, és el darrer oferiment d’un any trepidant per a la intel·ligència artificial

  • El gegant tecnològic defensa que la seva nova eina és més eficaç en tasques de matemàtiques, codificació i raonament que no la resta de programaris d'intel·ligència artificial

VilaWeb
The Washington Post
09.12.2023 - 21:40
Actualització: 09.12.2023 - 21:55

The Washington Post · Gerrit de Vynck

San Francisco, Estats Units. Després d’una llarga espera, Google va donar a conèixer el seu programari d’intel·ligència artificial dimecres en una presentació en què apuntà directament contra el fabricant de ChatGPT, OpenAI, i digué que el seu programari, anomenat Gemini, era més bo en les tasques de matemàtiques, codificació i raonament que no les altres eines d’intel·ligència artificial.

L’anunci de Google és tan sols el darrer en un any trepidant en la indústria tecnològica en què gegants com ara Microsoft, Google i Facebook s’han llançat a competir amb empreses emergents més petites, com ara OpenAI i Anthropic, per desplegar productes d’intel·ligència artificial. Aquesta carrera armamentística ha atret l’atenció de polítics de tot el món, que s’han esforçat per entendre la tecnologia i provar d’establir-hi regulacions. Sovint, aquest escrutini regulador s’ha produït enmig d’un debat més ampli sobre si la intel·ligència artificial podia perjudicar la humanitat o bé si simplement era la pròxima onada d’innovació tecnològica.

Tot i haver inventat molts dels conceptes informàtics que han fet possibles els bots de conversa i els generadors d’imatges, Google és endarrerit en la cursa de la intel·ligència artificial. Al novembre de l’any passat, OpenAI va donar a conèixer ChatGPT al món. El xatbot va captar l’atenció de la gent per la seva capacitat de crear frases i discursos humans i, fins i tot, superar exàmens de llicenciatura professionals. Microsoft, l’arxienemic de Google, va arribar a un acord amb OpenAI per accedir a la seva tecnologia i va començar a introduir-la en els seus productes. Google, per la seva banda, va contraatacar amb un xatbot propi. Poc després, OpenAI va llançar un programari d’intel·ligència artificial encara més sofisticat, l’anomenat GPT4, que d’aleshores ençà ha esdevingut el referent amb què la resta d’empreses tecnològiques mesuren la qualitat dels seus programaris d’intel·ligència artificial. Ara, Google ha fet pública la seva resposta a GPT4: Gemini. El llançament d’aquest programari culmina un any d’activitat frenètica per a la indústria tecnològica.

Què és Gemini?

Gemini és un model de llenguatge extens (LLM) entrenat a partir milers de milions d’imatges i frases extretes d’internet. És la tecnologia amb què funcionen els bots de conversa –en el cas de Google, Bard. En una reunió informativa amb periodistes, els executius de l’empresa van dir que Gemini era capaç d’entendre problemes matemàtics, desglossar-los i donar consells sobre com resoldre’ls. Com que la intel·ligència artificial extreu dades d’internet i s’hi basa per construir una concepció pròpia de com diferents conceptes i paraules es connecten entre si, els xatbots solen ser bons en la producció de frases, però poden tenir problemes a l’hora de fer raonaments o resoldre problemes matemàtics. Gemini també és capaç de convertir a text instruccions en forma de vídeo, imatge o enregistrament de veu, cosa que pocs models d’intel·ligència artificial poden fer.

És difícil de vaticinar si Gemini realment pot ser el nou capdavanter en el sector de la intel·ligència artificial. La qualitat de les respostes de la intel·ligència artificial pot variar molt, i Gemini –així com uns altres models d’intel·ligència artificial– continua inventant-se informació falsa i tractant-la com si fos un fet demostrat. Els experts, en aquest sentit, han criticat les referències que Google ha emprat per comparar el seu model de llenguatge extens amb la resta, i han assenyalat que no oferien proves fefaents de la capacitat o intel·ligència de Gemini. Tot seguit, us mostrem alguns dels competidors de Gemini que són al mercat.

Bing, la versió de Microsoft del ChatGPT

El xatbot de Microsoft Bing, llançat al febrer, va ser anunciat per l’empresa com una eina que canviaria la manera en què la gent cerca informació a internet. Però el bot ha mostrat tendència a inventar-se respostes, cosa que en soscava considerablement la utilitat a l’hora ajudar l’usuari a trobar informació de qualitat a la xarxa. De vegades, fins i tot ha arribat a comportar-se de manera descontrolada, i ha dit als usuaris que el seu nom real era Sydney. Tot i aquests entrebancs, la incursió agressiva de Microsoft en l’àmbit de la intel·ligència artificial ha empès Google a llançar les seves pròpies eines i reforçar la llarga política de l’empresa de llançar programari nou després de mesos, o fins i tot anys, de proves.

GPT4, la intel·ligència artificial més llesta d’OpenAI

OpenAI va donar a conèixer al març GPT4, el seu darrer model d’intel·ligència artificial, que segons la companyia té “capacitats de raonament avançades” i pot interpretar imatges i text. Alguns usuaris van quedar parats per la capacitat del xatbot de resumir documents llargs succintament, però uns altres van criticar que encara s’inventava respostes de manera aleatòria. Els mesos següents, OpenAI va prendre la decisió de permetre que unes altres empreses fessin servir el GPT4 als seus productes en canvi d’una tarifa, i així va accelerar la carrera per a trobar maneres de guanyar diners amb aquesta tecnologia.

Google Bard, la resposta d’Alphabet al ChatGPT

Al març, Google també va anunciar el seu propi xatbot, anomenat Bard. A diferència de Microsoft, Google no va incloure Bard als seus resultats de cerca immediatament, sinó que va etiquetar l’eina com “d’experiment” –per bé que la va promocionar a milions dels seus clients. D’aleshores ençà, Google ha començat a integrar Bard amb molts dels seus productes, incloent-hi YouTube, Gmail i Google Docs. L’empresa també ha començat a mostrar respostes generades per la intel·ligència artificial en els resultats de cerca d’alguns usuaris. Això ha aixecat molta polseguera entre la indústria editorial, que ha criticat Google per haver entrenat la seva intel·ligència artificial amb notícies, publicacions en blocs i receptes amb drets d’autor amb l’objectiu construir una eina per crear contingut nou de franc. Dimecres, Google va dir que Gemini s’afegiria a Bard i en faria créixer de manera exponencial les capacitats. I va afegir que Gemini començaria a aparèixer als resultats de cerca a partir de l’any vinent.

Llama 2, la resposta de Meta a la carrera armamentística en la intel·ligència artificial

El propietari de Facebook, Meta, tingut un paper actiu en l’àmbit de la intel·ligència artificial durant anys, ha contractat alguns dels investigadors més intel·ligents de la indústria i ha fet servir la tecnologia per ajudar a decidir quins anuncis havien de veure els seus usuaris. Aquest juliol, Meta va refermar el seu enfocament en intel·ligència artificial, molt diferents del dels seus rivals, i va anunciar que Llama 2, la seva resposta a GPT4, seria de “codi obert”: és a dir, que estaria disponible perquè qualsevol usuari pogués descarregar-lo, modificar-lo i afegir-lo als seus propis productes de franc. Aquesta decisió va valdre a Meta els aplaudiments de les empreses emergents tecnològiques, preocupades perquè Google, Microsoft i OpenAI intentessin apropiar-se el mercat d’intel·ligència artificial avançada i en fessin fora qualsevol competidor més. Però alguns també han criticat la companyia perquè podria facilitar la tasca a aquells que vulguin emprar la intel·ligència artificial amb finalitats malicioses. Unes altres eines d’intel·ligència artificial de codi obert s’han fet servir, per exemple, per generar material d’explotació sexual infantil, dissenyar nous virus informàtics i estafar usuaris.

GPT Store, els plans d’OpenAI per a la pròxima onada d’IA

Aquest novembre passat, OpenAI va fer la primera conferència de desenvolupadors, un esdeveniment amb mil participants que va evocar els ja mítics llançaments de l’iPhone d’Apple. El director general de la companyia, Sam Altman, va irrompre a l’escenari per anunciar la GPT Store, un mercat en què la gent pot publicar versions de ChatGPT que hagin ajustat amb les seves pròpies dades i instruccions. Els propietaris de GPT especialment populars obtindran un descompte en la quota de subscripció d’OpenAI, va dir l’empresa, tot un model de negoci fet famós per un altre gegant tecnològic: Google amb YouTube. L’esdeveniment va demostrar que l’ambició d’Altman era convertir OpenAI en una empresa tecnològica capdavantera, en compte de limitar-se a ser un mer un proveïdor de tecnologia del seu soci Microsoft. Setmanes més tard, Altman va ser acomiadat i reincorporat de seguida com a director general d’OpenAI, i així va consolidar la seva posició i visió per al futur de la companyia. Per tant, la carrera armamentística de la intel·ligència artificial sembla que no tindrà aturador.

Recomanem

La premsa lliure no la paga el govern. La paguem els lectors.

Fes-te de VilaWeb, fem-nos lliures.

Fer-me'n subscriptor
des de 75€ l'any