Apple Intelligence, una IA que arriba tard, limitada i amb la difícil promesa de la privacitat
Apple presenta la seva primera aposta pels models d'intel·ligència artificial generativa, amb més capacitats per a Siri i el conjunt d'apps del sistema, però no sorprèn i necessita un acord amb OpenAI per donar respostes més complexes
"Va més enllà de la intel·ligència artificial. És intel·ligència personal". Canviar el nom de tecnologies ja establertes per fer-les semblar úniques és habitual en el llibre d'estil de màrqueting d'Apple, els creadors de la "computació espacial" per parlar de la seva aposta per la realitat virtual o mixta. En aquesta ocasió, l'empresa té alguns arguments per justificar-ho.
Les paraules d'introducció eren de Tim Cook, CEO d'Apple, durant la presentació de la WWDC 224, la conferència anual per a desenvolupadors on, entre altres anuncis, van presentar dilluns al vespre la seva primera aposta ferma per les IA generatives: Apple Intelligence.
"És el pròxim gran pas d'Apple", afegia. Apple vol que aquestes eines siguin personalitzades i funcionin amb la informació local que els usuaris guardin en els seus dispositius i s'integrin transversalment en totes les aplicacions i serveis que ofereix:
"La IA t'ha d'entendre i estar fonamentada en el teu context personal com la teva rutina, les teves relacions, les teves comunicacions i moltes coses més".
La IA d'Apple arriba tard en la intensa carrera que protagonitzen Google i OpenAI (Microsoft), un any i mig després que es fes públic ChatGPT, i el resultat no és particularment impressionant ni revolucionari en cap aspecte, però sens dubte marcarà un punt d'inflexió en la introducció dels models de llenguatge dins els dispositius mòbils.
Apple Intelligence és el conjunt de capacitats basades en IA que l'empresa de la poma integra en el sistema operatiu dels seus telèfons, ordinadors portàtils, tauletes, és a dir, iOS 18, macOS Sequoia i iPadOS 18 o visionOS 2.
Aquesta tardor, doncs, Apple estrenarà per a tothom* un conjunt de models de llenguatge propis per generar text, processar àudio, analitzar el contingut d'imatges, editar-les i crear il·lustracions, tot integrat transversalment en el sistema, interactuant amb diferents aplicacions i serveis.
*Les novetats d'Apple Intelligence arribaran progressivament i, de moment, només per als usuaris de l'iPhone 15 Pro o iPhone 15 Max, dispositius amb xip M1 o superior, i la versió de Siri en anglès. Una versió en beta ja es podrà començar a provar aquest estiu.
ChatGPT dins de l'iPhone, un acord polèmic
El control de les noves eines d'Apple Intelligence es farà, principalment, a través d'un renovat assistent virtual Siri i, puntualment, connectant-se als servidors d'OpenAI per ajudar a donar resposta allà on no arribin les seves capacitats.
Precisament, l'acord entre Apple i OpenAI per integrar el model actual de ChatGPT, GPT-4o, dins els seus dispositius ha estat l'anunci més cridaner, tot i haver estat llargament esperat i rumorejat.
We're partnering with Apple to integrate ChatGPT into iOS, iPadOS, and macOScoming later this year: https://t.co/HP77fVO6gA
OpenAI (@OpenAI) June 10, 2024
"Col·laborem amb Apple per integrar ChatGPT a iOS, iPadOS i macOS- [una novetat que] arribarà a finals d'any"
La resposta pública més crítica ha arribat d'Elon Musk, un dels membres inicials del Consell d'Administració d'OpenAI i actual propietari de Tesla, SpaceX, X (Twitter) i la seva pròpia aposta per la intel·ligència artificial, xAI.
Musk considera que, fruit de l'acord, "Apple no té ni idea de què passa realment un cop entrega les vostres dades a OpenAI" i ha amenaçat de prohibir els dispositius d'Apple a les seves empreses:
Elon Musk (@elonmusk) June 10, 2024
"Si Apple integra OpenAI al nivell del sistema operatiu, els dispositius Apple seran prohibits a les meves empreses. Això és una violació de seguretat inacceptable"
Pel que s'ha explicat, Apple no integra el model d'OpenAI dins el seu sistema operatiu sinó que, en situacions molt concretes, Siri preguntarà si l'usuari vol rebre una resposta a la seva petició a través del model GPT-4o i, només aleshores, enviarà la petició als servidors d'OpenAI per retornar la resposta a continuació.
Aquesta transacció de dades, tanmateix, és una novetat important en una empresa que, com va tornar a insistir durant tota la presentació, posa sempre l'accent en la privacitat, però acaba d'entrar en un terreny on mantenir l'equilibri entre seguretat i utilitat és realment difícil.
Siri, ara més íntim i més intel·ligent
L'assistent virtual d'Apple ja té més de 10 anys, però les de dilluns van ser les novetats més importants que s'hi han introduït mai pel que fa a l'augment de les seves possibilitats.
Siri es beneficia d'aquest vernís d'IA que arriba a tot arreu amb una sèrie de noves capacitats que van més enllà d'alguns canvis estètics, com per exemple que ara, quan s'invoqui Siri, tot el marc de la pantalla del dispositiu brilli.
L'assistent de veu estarà més integrat en el sistema, de manera que podrà respondre a preguntes o fer accions en qualsevol app o lloc del telèfon, fins i tot moure's en múltiples apps al mateix temps. També podrà entendre, per context, quan l'usuari fa referència a l'app que s'està executant en aquell moment.
És a dir, si li dius a Siri "envia-li la foto que vaig fer ahir en el parc" en plena conversa per missatges amb un amic, l'assistent entendrà que ha de buscar una imatge feta el dia anterior on es vegi un parc i enviar-li al contacte amb qui s'està parlant a través de l'app oberta.
L'empresa anomena aquesta funcionalitat App Intents, que de moment funcionarà en les apps pròpies d'Apple, però ja han avançat que s'obrirà a empreses de tercers que podran definir quines accions pot executar Siri si l'usuari els ho demana.
Com que Apple Intelligence també compta amb reconeixement d'imatges, el sistema ens permetrà fer cerques naturals de qualsevol fotografia, tan sols descrivint-ne els continguts, perquè el sistema ens retorni la imatge que buscàvem d'entre totes les que tenim en la nostra biblioteca.
També, amb la mateixa tecnologia d'interpretació d'imatges, podrà fer vídeos recopilatoris de les fotos de la biblioteca tot seguint les instruccions que se li indiquin.
A més, ja no cal fer servir obligatòriament la veu: ara també es podrà parlar amb Siri per escrit, de manera que es poden fer peticions silencioses, descriure el que es necessita i conversar amb Siri més íntimament.
Fins i tot, amb els AirPods posats, es pot fer que sí o que no amb el cap per respondre o rebutjar trucades, entre d'altres:
Apple $AAPL just announced a new feature for AirPods that lets you nod your head yes or no to interact with Siri pic.twitter.com/N2q7esJ2zn
Evan (@StockMKTNewz) June 10, 2024
Writing Tools, assistència per l'escriptura a tot arreu
En el conjunt d'eines que Apple engloba dins la seva nova intel·ligència hi ha Writing Tools, eines que es proposen ajudar l'usuari en qualsevol app o racó del sistema on hi hagi un espai dedicat a l'escriptura: correu electrònic, notes, missatges...
Les noves capacitats d'intel·ligència d'Apple permetran resumir textos, convertir-los en punts més fàcils de digerir, proposar canvis de to o estil per fer textos més formals o més divertits (amb l'eina "Rewrite" o "Reescriure") o rebre propostes de respostes intel·ligents automàtiques pel missatge o correu electrònic rebut.
Les noves possibilitats no són molt diferents del que ja ofereix la competència en altres aplicacions i sistemes operatius, com Google amb Gemini o Microsoft amb Copilot, però inclou algunes novetats com la capacitat de detectar quins són els missatges rebuts més rellevants i resumir-ne el contingut en notificacions escurçades automàticament per fer-les més útils.
Apple Intelligence també permetrà gravar trucades (avisant prèviament els interlocutors) i transcriure i resumir-ne el contingut, una tasca que també podrà fer amb gravacions de veu.
Genmoji i Image Playground, dibuixos artificials en el mòbil
El model de generació d'imatges que introdueix Apple Intelligence ofereix possibilitats molt limitades que no inclouen la generació de fotografies realistes, molt segurament per esquivar potencials polèmiques.
Apple permet crear emojis personalitzats tot escrivint el que volem generar en la seva nova eina "Genmoji", que generarà la versió dibuixada de qualsevol contacte o persona que tinguem en fotografies reals.
Per altra banda, Image Playground és un espai que Apple ofereix per generar qualsevol dibuix que li demanem, a l'instant, en estil animació, esquetx o il·lustració.
De la mateixa manera, en aplicacions com Notes ara és possible fer gargots que, quan els encerclem, es convertiran en versions de més qualitat i detall, es millorarà la nostra cal·ligrafia automàticament i es podran obtenir el resultat d'operacions matemàtiques que hàgim escrit a mà.
Privacitat i personalització: una promesa difícil
Combinar personalització, intel·ligència artificial i privacitat és una tasca molt difícil. Els models necessiten una quantitat ingent de dades per funcionar i, si s'insisteix tant en personalització, com fa Apple, es perd en seguretat: el model necessita treballar informació privada per ser realment personal.
Durant la presentació d'Apple Intelligence, s'ha pogut veure una empresa que sempre defensa la privacitat com una de les seves prioritats i que va amb peus de plom amb les novetats que presenta. La generació d'imatges limitada als dibuixos n'és un exemple.
Apple promet seguretat i privacitat com a elements "fundacionals" i definitoris d'Apple Intelligence, però entra en un món tecnològic on l'intercanvi de dades és imprescindible.
D'una banda, "molts dels seus models" (no pas tots) funcionen en local, dins el mateix dispositiu, de manera que s'assegura que la majoria de vegades la informació que s'hi introdueixi no sortirà del telèfon per passar per cap servidor, ni d'Apple ni de ningú més.
Per tasques més exigents, on el processament necessari és més alt, Apple posa a disposició el que anomenen Private Cloud Compute (Computació Privada al Núvol), servidors amb xips d'Apple en què asseguren que les dades no es guardaran mai i seran esborrades un cop acomplerta la tasca, a més de ser servidors verificats externament i independentment.
Ara bé, què són tasques exigents? ¿Cada quant de temps Apple haurà d'enviar dades a servidors per donar resposta a les peticions i quin percentatge es respondrà realment en local?
D'altra banda, hi ha l'acord amb OpenAI, que els obliga a enviar-hi informació quan Siri no sigui capaç de respondre el que se li demana i necessiti un cop de mà de ChatGPT.
Apple Intelligence s'estrena limitat en la carrera per desenvolupar models generatius. Les seves precaucions i límits fan que les capacitats que té se'n ressentin.
Limitat pels seus mateixos models, que encara necessiten unes quantes generacions per augmentar en potència i capacitats. Limitat per una política de privacitat i seguretat que acoten les tasques que pot dur a terme la seva intel·ligència artificial. I limitat per la capacitat finita de processament dels seus xips quan volen executar les tasques de manera local per tal d'evitar enviar res a ningú.
Apple ha entrat en la carrera per la IA generativa, però sembla que ho fa sense pressa, a una distància important dels models de llenguatge més populars, com Gemini de Google, GPT d'OpenAI o Copilot de Microsoft.
Això, en realitat, és una bona notícia que agrada més als usuaris pendents de la seva privacitat que no pas als inversors i les borses.
- ARXIVAT A:
- TecnologiaAppleIntel·ligència artificial