Da domani il vostro computer cambierà per sempre
Microsoft ha annunciato una grossa novità in arrivo domani, 26 settembre, su Windows 11. Si chiama Copilot e rischia di cambiare per sempre il computer come l'abbiamo inteso fino ad oggi.
Tempo stimato per la lettura: 11 minuti
La parola di oggi: Intelligenza Artificiale Generativa, ovvero i modelli di intelligenza che non solo apprendono, ma che sono in grado di creare qualcosa di originale. Di generare - appunto - testi, immagini o musica.
IL MENÚ DI OGGI
Le novità di Microsoft per Windows 11 in arrivo domani, 26 settembre. Un assistente virtuale, Copilot, che sarà in grado di fare un sacco di cose al posto vostro, semplicemente chiedendoglielo tramite chat, come se stesse messaggiando con un essere umano;
L’integrazione di un modello di intelligenza artificiale, come ChatGPT, può cambiare per sempre il modo in cui abbiamo usato il computer fino ad oggi, perché possiamo facilmente aggirare le difficoltà rappresentate dalla conoscenza dei software e dell’informatica;
L’uso spavaldo di queste chat però non è senza rischi. Le intelligenze artificiali, infatti, sbagliano spesso e mentono. E c’è una spiegazione scientifica per questo comportamento.
» IL VOSTRO COMPUTER NON SARÁ PIÚ LO STESSO
Non ha avuto la risonanza mediatica che meritava l’evento di Microsoft della scorsa settimana. Durante l’evento, sono state presentate le novità dell’aggiornamento di Windows 11 22H2 in arrivo il 26 settembre. Di solito mi interessa poco fare il decalogo delle novità tecniche annunciate. Di solito, ma non questa volta.
Questo aggiornamento introduce infatti qualcosa che rischia di cambiare per sempre il nostro modo di usare il computer. Si tratta infatti di Windows, il sistema operativo più diffuso nei computer di tutto il mondo. Quello che Microsoft sta introducendo è la più grossa implementazione pratica vista fino ad oggi di quello di cui ci stiamo occupando da mesi: l’intelligenza artificiale.
L’aggiornamento (gratuito) di Windows 11 arriverà il 26 settembre (domani se leggerete questa Insalata il giorno dell’uscita) e introdurrà una barra laterale, Copilot, che permetterà all’utente di utilizzare l’intelligenza artificiale praticamente in ogni contesto; questo cambierà tutto, per sempre. Pensate solo a questo scenario: dovete ottenere dei dati da una tabella Excel ma non conoscete le formule da usare? Basterà chiederlo a Copilot e lui lo farà al posto vostro.
Da qui non si tornerà indietro: l’aggiunta di una chat a cui poter parlare come se fosse un essere umano, pronta ad aiutarti in ogni contesto, credo rappresenti davvero uno dei più grandi balzi in avanti della tecnologia, da anni. E forse, presi da un iPhone in titanio o dall’ultimo aggiornamento di Whatsapp, gli stiamo dando davvero troppo poco peso.
Buona lettura.
Franco A.
» COS’È COPILOT E COSA C’ENTRA CON L’INTELLIGENZA ARTIFICIALE
Qualche giorno fa mia moglie mi ha chiesto:«come faccio a usare l’intelligenza artificiale per migliorare delle foto?». Una domanda tutt’altro che banale.
Sono mesi che parliamo di intelligenza artificiale generativa, di modelli di linguaggio, di ChatGPT1, di Midjourney2 (tranquilli, se non sapete di cosa sto parlando, tra poco ci arrivo)… ma avete mai provato a utilizzare Midjourney? Io si, ed è la cosa meno intuitiva del mondo. Innanzitutto bisogna utilizzare Discord (un sistema di messaggistica molto popolare tra i gamer), entrare in una “stanza” particolare e poi usare dei comandi insieme alla descrizione dell’immagine che si vuole ottenere. Poi, in mezzo ad altre centinaia di immagini generate per altri utenti che nel frattempo stanno richiedendo immagini insieme a voi, arriverà la vostra, che dovrete essere veloci a individuare nello scorrimento frenetico del feed di altre richieste.
È praticamente la versione digitale delle scene di Wall Street che si vedono nei film come “Una poltrona per due”, in cui centinaia di persone si accalcano gridando con dei foglietti in mano sperando che qualcuno gli dia retta.
Da domani - inteso proprio come 26 settembre, non in senso figurato - cambierà tutto. Windows 11 integrerà tutto il set di strumenti a base di intelligenza artificiale, dalla chat al generatore di immagini. E tutto questo non sarà soltanto all’interno di Windows, ma anche all’interno di Office e del browser Edge.
Vi arriva un’email troppo lunga? Potete selezionarne il testo, aprire l’assistente Copilot e chiedergli di farvi un riassunto. Dovete creare un testo da usare come descrizione in una slide di Power Point? Aprite Copilot, gli date due informazioni e gli chiedete di crearvi il testo.
Vi serve un’immagine per corredare una presentazione, magari aggiungendo una persona e rimuovendo qualche oggetto dallo sfondo? Di nuovo: aprite Copilot, caricate l’immagine e chiedete all’assistente di generare l’immagine. Non digitando complessi comandi o peggio ancora programmando, bensì parlandogli come parlereste a un essere umano. Se non è una rivoluzione questa!
Microsoft ovviamente non è sola in questa corsa verso l’integrazione di modelli di linguaggio attraverso una chat. Anche Google sta integrando la sua chat, Bard, all’interno dei suoi strumenti di produzione e collaborazione. Certo però che integrare questa forma di intelligenza artificiale nel sistema operativo più diffuso sui computer, fa una grande differenza.
Tutto questo è dovuto alla velocità con cui Microsoft ha saputo intercettare e reagire a uno dei trend più importanti del momento. Ha investito pesantemente in OpenAI, la società che c’è dietro ChatGPT e DALL-E, integrandone i servizi all’interno del motore di ricerca Bing e del suo browser Edge alla velocità della luce. Tant’è che fece molto discutere la lentezza e la goffaggine con cui rispose Google, arrivata allo stesso risultato con mesi di ritardo.
Insomma, quello a cui abbiamo assistito è stato un ribaltamento completo dei ruoli: Google, la mega corporation con la mentalità da Startup, sempre pronta a cambiare e a intercettare i nuovi trend, è arrivata mesi dopo Microsoft, un’azienda ritenuta da sempre un pachiderma che reagisce alle novità con la velocità di un bradipo.
» DA DOVE È PARTITO TUTTO
Ma perché parliamo di “modelli di linguaggio”? E soprattutto: che diavolo è in pratica l’intelligenza artificiale? Forse è proprio arrivato il momento di fare un po’ di chiarezza sulla terminologia.
Anzitutto è importante precisare una cosa: per intelligenza artificiale si intende tutto e niente. È in pratica il nome divulgativo che viene dato a tutto ciò che in questi anni è stato sviluppato attorno a tutto ciò che la macchina è in grado di fare senza l’aiuto dell’uomo. Nei videogiochi, per esempio, si parlava di intelligenza artificiale decenni fa, facendo riferimento a tutti quegli algoritmi scritti per dare l’idea di un comportamento il più umano possibile ai nemici e far sì che si potessero comportare nel modo più imprevedibile possibile (o più umanamente prevedibile, se volete).
Poi sono arrivati gli assistenti vocali, da Siri ad Alexa, a portare l’intelligenza artificiale nelle nostre vite. Di nuovo, però, di vera intelligenza ne abbiamo vista ben poca. Certo il modello vocale è evoluto tanto e per qualche tempo ci siamo divertiti a chiedere a Siri qualcosa che era stato ampiamente previsto dai suoi sviluppatori, dalle barzellette alle domande imbarazzanti.
Poi però, a novembre 2022, è successo qualcosa che non ci aspettavamo: è arrivata ChatGPT, ed è stato il primo esempio diffuso, liberamente accessibile da chiunque, di come l’intelligenza artificiale fosse qualcosa di molto concreto. In questo caso, quando parliamo di intelligenza artificiale, stiamo parlando in realtà di machine learning, ovvero di tecniche di apprendimento automatico con le quali abbiamo addestrato una macchina.
Quando parliamo di “modelli di linguaggio”, stiamo in pratica facendo riferimento a modelli di apprendimento dedicati al linguaggio. Modelli a cui sono stati dati in pasto decine, centinaia, se non milioni di testi da apprendere appunto secondo un preciso modello. E così la macchina ha imparato e infatti, a stupire di queste chat di cui parliamo, non sono tanto i risultati, quanto il fatto che capiscano tutto quello che gli si chiede e che siano capaci di rispondere in un italiano perfetto.
Come fanno le macchine ad apprendere? I modelli di apprendimento affondano le radici nei secoli scorsi, non sono nati ieri. A partire dalle tecniche statistiche sviluppate a partire dal XVII secolo, per arrivare a Alan Turing, il matematico e logico britannico che accese la miccia dell’informatica. Poi, con l’evoluzione dei computer negli anni ’70, gli scienziati furono finalmente in grado di portare queste teorie fuori dal laboratorio e sperimentarle in modo pratico.
Si è arrivati così ai modelli predittivi, in grado di simulare un comportamento futuro di una serie di dati analizzata secondo il modello di apprendimento. Se diamo alla macchina una serie di dati, e le chiediamo di analizzarli secondo un modello, la macchina sarà in grado di fare una previsione sull’andamento futuro.
Oppure è in grado, addestrandola sulle fattezze di un animale, di riconoscere lo stesso animale in una serie di foto che le faremo analizzare. Si basano su questi algoritmi tutte le funzioni che permettono ai vostri smartphone di riconoscere le persone all’interno delle foto, oppure di trovare tutte le foto che contengono, genericamente, il mare, un albero o qualsiasi altro elemento siano state allenate a riconoscere.
Di certo tutto è cambiato con l’intelligenza generativa, ovvero quelle di cui stiamo parlando: ChatGPT, Midjourney e compagni. Queste intelligenze, oltre che parlare un linguaggio perfettamente naturale, apprendere e prevedere comportamenti futuri, sono anche in grado di creare. Una caratteristica che è da sempre prerogativa dell’uomo e che facciamo fatica a conciliare con la macchina, a cui possiamo affidare qualsiasi compito che non abbia a che fare con l’estro creativo umano.
Le macchine oggi non solo creano, come l’uomo, ma proprio come l’uomo sbagliano. E tanto. Dunque che rischi apre questo nuovo capitolo della storia umana?
» I RISCHI DI UN INTELLIGENZA CHE SBAGLIA SEMPRE
Pensateci bene: se la macchina ha imparato ad apprendere (scusate il gioco di parole, ma di base è questo), e lo fa a una velocità che per l’uomo sarebbe impensabile, quanto ci metterà ad apprendere anche gli errori? Già, perché se c’è una cosa sulla quale la macchina non è stata ancora addestrata, è la capacità discrezionale di capire quando quello che apprende è vero o è falso.
Se l’apprendimento di questi sistemi è basato, per esempio, sui testi di siti presenti in rete, significa che incamereranno anche notizie false, parziali, pregiudiziali, legate a convinzioni e a visioni personali di chi ha scritto quel testo. Il modello di apprendimento potrebbe quindi credere a un sito negazionista dell’Olocausto e rispondere all’utente che chiede informazioni sulla seconda guerra mondiale, che la Germania non ha mai sterminato milioni di esseri umani per via della religione.
Esempi di errori di questo tipo ne vediamo tutti i giorni, perché questi modelli apprendono e poi creano risposte spesso miscelando le informazioni che hanno appreso. Il loro scopo è basato infatti su un sistema probabilistico (di nuovo, parliamo di statistica), dunque la risposta non deve per forza essere esatta, ma semplicemente il più possibile vicino alla realtà. Si tratta di percentuali, non di verità assoluta.
» ORA LE MACCHINE CREANO
Da qui si arriva al più grande paradosso moderno: le chat e i sistemi di generazione delle immagini basate su intelligenza artificiale, piuttosto che non risponderti, inventano una fesseria.
Questo è stupefacente, perché si tratta di un comportamento più umano che artificiale. Da un essere umano, imbarazzato da una domanda a cui non sa rispondere, ci aspetteremmo che si inventi una risposta. Dalla macchina, che è un insieme di comandi logici, freddi e razionali, ci aspetteremo invece una risposta tipo “non sono in grado di rispondere”.
Invece no, la macchina inventa. Perché il suo scopo è avvicinarsi a livello probabilistico alla risposta. Non capiterà mai che una di queste chat non risponda alle nostre domande. Il problema vero è: se non è in grado di discernere la qualità della fonte da cui apprende, quanto ci vorrà prima che inventi delle risposte completamente sbagliate e che queste risposte vengano prese come vere da chi sta usando la chat?
Vi rispondo io: è già successo. È diventato infatti celebre il caso di Steven A. Schwartz, avvocato di New York, che nel difendere in tribunale Roberto Mata, citò una serie di casi di giurisprudenza che non erano mai realmente accaduti. L’avvocato, come poi confessò, si era rivolto a ChatGPT, che semplicemente si era inventata dei casi analoghi a quello del suo cliente.
In quel caso, ChatGPT aveva semplicemente mischiato casi, probabilmente reali, con la vicenda del suo assistito, cercando di dare una risposta che fosse quanto più vicina possibile a quello che le era stato chiesto. A volte però, come sappiamo, vicino può essere comunque troppo poco.
» IL FUTURO È UN COMPUTER CHE SBAGLIA?
Detto tutto questo, possiamo davvero fidarci di un computer che integra un modello di intelligenza artificiale che è si è allenato su dati la cui correttezza non può essere provata?
Bisogna fare un’importante distinzione. Innanzitutto, Copilot sarà un vero assistente virtuale, un po’ un successore di Cortana, che era l’assistente vocale analoga a Siri o Alexa che arrivò insieme a Windows 10. Microsoft poi chiuse il progetto, ma ora è tornata con la versione rivista e corretta.
Copilot serve ad aiutare l’utente nelle operazioni di tutti i giorni, lavorando al posto suo e facendogli superare tutti gli ostacoli determinati dalla scarsa conoscenza dell’informatica e dei software.
In questo senso è davvero un cambio epocale. È evidente che se chiederemo a Copilot di aiutarci a scrivere meglio un concetto che già abbiamo in testa, non potrà che aiutarci. Se invece chiediamo a Copilot di aiutarci a scrivere qualcosa di cui non sappiamo un accidente, il rischio è dietro l’angolo.
Insomma, è un po’ come andare in giro per il web a leggere la prima fesseria sui vaccini e scriverci un articolo su un giornale. Nessuno mi vieta di farlo anche oggi, pur senza utilizzare l’intelligenza artificiale.
Sono tanti gli esempi in cui la chat di Bing o ChatGPT sono stati utilizzati per scrivere codice, per esempio. Da quel punto di vista questi aiutanti sono preziosissimi: scrivono un codice perfetto e te lo spiegano pure. Così, in poche parole, funzionano come un maestro sempre pronto a spiegarti e a rispiegarti qualcosa che non hai capito. Non voglio immaginare quanto possano essere utili per uno studente di materie scientifiche come matematica o fisica.
Non ti è chiaro un teorema? Gli chiedi di spiegartelo. Non lo capisci ancora? Ti puoi far fare un esempio e alla fine puoi chiedergli di correggere l’esercizio che hai fatto.
Poi magari, vista la semplicità, ti può venir voglia di farti fare un riassunto di un capitolo del libro di storia e qui invece sbaglieresti, perché rischieresti che la risposta cada nel rischio di cui parlavamo prima, ovvero che mischi informazioni reali ad altre completamente sbagliate. Meglio attenersi a cose che non ammettono interpretazioni, come i teoremi di matematica o le leggi fisiche (seppure io non possa escludere che in rete qualche libera interpretazione si possa trovare anche di queste cose).
Microsoft ha, in altre parole, fatto compiere a Windows un balzo in avanti clamoroso. L’ha fatto anche fugando i principali dubbi posti da chi ha scritto i contenuti che questi modelli hanno appreso. Bing e Copilot infatti accreditano sempre la fonte da cui hanno prelevato le informazioni. E sono quasi certo, anche se non posso ancora saperlo (non avendo testato la beta), che si possa fornire un feedback sulla qualità della risposta fornita da Copilot.
Insomma, per ora un grandissimo pollice alzato per Microsoft. Ben fatto, non vediamo l’ora di usare Copilot.
» SFAMA LA FOMO!
Cos’è la F.O.M.O.?3
Torno ancora sull’imminente aggiornamento di Windows per parlare di due funzioni che integrerà nell’applicazione Paint e in Photo. La prima permetterà infatti di rimuovere automaticamente lo sfondo delle foto e renderlo trasparente, sempre tramite l’uso di intelligenza artificiale. La seconda, permetterà di sfocare lo sfondo e di trovare persone e oggetti all’interno delle foto. Un’altra implementazione pratica dell’intelligenza di cui parlavamo. Ma ve lo ricordate Paint? Fino a poco tempo fa ci si poteva si e no disegnare pixel per pixel, e ora integra l’intelligenza artificiale. Viene quasi da piangere…
Whatsapp arriverà finalmente anche su iPad. È stata infatti rilasciata la versione beta compatibile con i tablet Apple e il rilascio della versione definitiva è previsto a brevissimo. Le funzionalità sono analoghe alle versioni desktop lanciate da qualche mese. Meglio tardi che mai anche se, personalmente, non sentivo proprio tutta questa necessità di ricevere i messaggi dei gruppi anche su iPad.
Brutte notizie per gli abbonati Amazon Prime Video, il servizio di video on demand di Amazon. Nel 2024 l’Italia sarà infatti uno dei primi mercati a sperimentare le pubblicità. Per chi vorrà godersi i contenuti di Prime Video senza pubblicità, dovrebbe essere possibile disattivarla se, come presumibile, si dovesse seguire il modello statunitense, dove l’eliminazione della pubblicità richiede un supplemento mensile di 2,99$. D’altronde, Amazon mette obiettivamente troppe cose nell’abbonamento da 49,90 € l’anno. Dopo l’iniziale aumento di 10€, ne seguiranno senza dubbio altri. D’altronde il modello americano funziona così: prima ti fanno abituare a un servizio gratuito o quasi, e poi arriva la stangata. Però la soluzione c’è: basta non rinnovare.
Se sei arrivato fino a qui, innanzitutto ti ringrazio.
Non ci siamo presentati: mi chiamo Franco Aquini e da anni scrivo di tecnologia e lavoro nel marketing e nella comunicazione.
Se hai apprezzato la newsletter Insalata Mista ti chiedo un favore: lascia un commento, una recensione, condividi la newsletter e più in generale parlane. Per me sarà la più grande ricompensa, oltre al fatto di sapere che hai gradito quello che ho scritto.
Franco Aquini
ChatGPT è uno strumento lanciato a novembre 2022 da OpenAI, una società che ha ricevuto finanziamenti da Microsoft per diverse decine di miliardi di dollari. ChatGPT è stato il primo esperimento pubblico di intelligenza artificiale generativa, a cui poter chiedere qualsiasi cosa semplicemente scrivendo in una chat.
Midjourney è un sistema di intelligenza artificiale generativa, che si occupa di generare immagini in base a una descrizione fornita sempre tramite una chat. Esiste anche una versione di Midjourney fatta da OpenAI, quella di ChatGPT, che si chiama DALL-E.
La F.O.M.O., un acronimo che sta per Fear Of Missing Out, è la deriva moderna del tam tam dei social network unita all’enorme disponibilità di strumenti di informazione e di intrattenimento. In pratica, è la paura di perdersi qualcosa e di non essere sempre al passo con i tempi. Con questa rubrica rispondiamo a queste paure, riassumendo in breve le notizie più significative della settimana, pescate dal mondo della tecnologia, dell’entertainment e del lifestyle.