IntelliGuide Logo

Storia dell’Intelligenza Artificiale:
da Turing ai Giorni Nostri

UN PERCORSO CHE STA CAMBIANDO IL MONDO

Da un’idea decisamente audace risalente agli anni Quaranta, fino agli attuali LLM multimodali, in quest’articolo ripercorreremo insieme le tappe fondamentali della storia dell’Intelligenza Artificiale: un percorso affascinante, costellato di entusiasmi travolgenti e delusioni altrettanto cocenti, di ricercatori ostinati che non smisero mai di credere nella propria intuizione e di scoperte che cambieranno sempre più il mondo che ci circonda e il modo con cui ci rapportiamo ad esso. Buon viaggio!

( di: Antonio Maria Guerra | data: 24/04/2026 )
Storia dell’Intelligenza Artificiale: le radici di una rivoluzione.

Storia dell’Intelligenza Artificiale: le radici di una rivoluzione.

Per quanto ad alcuni possa ‘suonare strano’, la storia dell’Intelligenza Artificiale non inizia con ChatGPT, tutt’altro. Le sue radici affondano infatti in un periodo storico drammatico legato ai nostri nonni: la Seconda Guerra Mondiale. Correva l’anno 1943 quando Warren McCulloch, neurofisiologo dell’Università dell’Illinois, e Walter Pitts, logico autodidatta, pubblicarono un paper destinato a cambiare per sempre il corso della scienza (*1). Il titolo dell’opera era ostico, A Logical Calculus of the Ideas Immanent in Nervous Activity, ma il contenuto, a ben vedere, era altrettanto rivoluzionario: in esso i due ricercatori ipotizzarono che il funzionamento dei neuroni del cervello umano poteva essere riprodotto matematicamente, alla stregua di ‘piccoli interruttori’ capaci di accendersi e spegnersi in risposta a determinati stimoli.

L’intuizione era indubbiamente straordinaria: partendo dall’assunto che il cervello umano funziona come una rete di neuroni interconnessi, introducevano per la prima volta l’idea che fosse possibile replicarne il meccanismo … all’interno di una macchina!
Ovviamente, nel 1943, nessuno aveva la potenza di calcolo né i dati necessari per mettere in pratica la loro ardita teoria, ma il seme era stato comunque piantato. E da quel seme sarebbe scaturito, decenni dopo, il Deep Learning moderno.

Nota:
*1: McCulloch W., Pitts W., ‘A Logical Calculus of the Ideas Immanent in Nervous Activity’, Bulletin of Mathematical Biophysics, 1943.

1943

PODCAST: Storia dell’Intelligenza Artificiale.

McCulloch e Pitts: due scienziati e un’idea che avrebbe cambiato tutto.

McCulloch e Pitts: due scienziati e un’idea che avrebbe cambiato tutto.

Warren McCulloch e Walter Pitts erano, per formazione e carattere, due persone profondamente diverse tra loro. Nella fattispecie, McCulloch era un neurofisiologo di professione, metodico e radicato nel mondo della medicina e della biologia.

Pitts invece era qualcosa di più difficile da definire: ragazzo prodigio, praticamente autodidatta … in sostanza, un genio della matematica! Ebbene, fu proprio questa ‘strana coppia’ a firmare nel 1943 uno dei paper più citati nella storia della scienza, con oltre 14.000 citazioni documentate (*1). Va anche detto che la loro collaborazione nacque da un interesse comune: capire come il cervello umano elabora le informazioni e se fosse possibile tradurre questo processo in termini matematici.
Una domanda solo apparentemente filosofica che, nelle mani di queste persone, divenne il punto di partenza della rivoluzione scientifica che avrebbe portato alla nascita della IA.
È interessante infine notare che il loro lavoro restò per decenni nell’ombra, considerato (guarda un po …) troppo astratto per avere applicazioni pratiche. Solo molti anni dopo, con l’avvento di computer sufficientemente potenti, il mondo si sarebbe accorto che McCulloch e Pitts avevano ‘precorso un pò troppo i tempi’.

Nota:
*1: Dati citazioni da Springer Nature.

1943

Quando la guerra accelerò il futuro.

Quando la guerra accelerò il futuro.

C’è un trait d’union che collega la Seconda Guerra Mondiale alla nascita dell’Intelligenza Artificiale. Per decrittare i cifrari dell’esercito tedesco, i governi alleati investirono infatti risorse enormi nello sviluppo di calcolatori elettronici. In Gran Bretagna nacque il ‘Colossus’, progettato dall’ingegnere Tommy Flowers e considerato il primo computer programmabile della storia (*1): una macchina capace di eseguire operazioni logiche a velocità incredibili per l’epoca.
Fu proprio in questo contesto che un giovane e brillante matematico britannico si distinse per aver ideato la ‘Bombe’, il dispositivo elettromeccanico che permise di decifrare i messaggi di ‘Enigma’: sofisticato sistema di criptazione utilizzato dalla Germania durante il conflitto. Il suo nome era Alan Turing, e avrebbe avuto un ruolo di primo piano nella nascita dell’IA moderna.

*1: Copeland B.J., “Colossus: The Secrets of Bletchley Park’s Codebreaking Computers”, Oxford University Press, 2006.

1943

Alan Turing: la visione dell’IA ed il celebre ‘test’.

Alan Turing: la visione dell’IA ed il celebre ‘test’.

La nascita dell’Intelligenza Artificiale è strettamente legata a un matematico britannico di nome Alan Turing, personalità divenuta leggendaria durante la Seconda Guerra Mondiale grazie al suo contributo nel decriptare i messaggi nazisti elaborati dalla celebre macchina ‘Enigma’. Contributo che, come è facile immaginare, fu determinante per la vittoria degli Alleati.
Ebbene, come se non avesse già fatto abbastanza per la storia dell’umanità, nel 1950 questo ‘geniaccio’ pubblicò sulla rivista accademica ‘Mind’ (*1) un articolo che si apriva con una domanda semplice quanto rivoluzionaria: “Can machines think?”, ovvero, “Le macchine possono pensare?”.
A quanto pare un futuro fatto di ‘macchine pensanti’ era, già al tempo, molto chiaro nella sua mente.
Fatto sta che nel medesimo articolo lo scienziato propose il celebre ‘Test di Turing’, una ‘prova’ legata a un’intuizione tanto elegante … quanto provocatoria: se una macchina fosse riuscita a sostenere una conversazione con un essere umano in modo tale da non essere distinguibile da un altro essere umano, allora quella macchina poteva essere considerata intelligente.
Ancora oggi, a oltre settant’anni di distanza, questo test continua ad alimentare il dibattito su cosa significhi davvero ‘pensare’.

*1: Turing A., “Computing Machinery and Intelligence”, Mind, vol. 59, n. 236, ottobre 1950.

1950

Dartmouth 1956: nasce ufficialmente l’Intelligenza Artificiale.

Dartmouth 1956: nasce ufficialmente l’Intelligenza Artificiale.

Se McCulloch e Pitts avevano gettato le fondamenta teoriche con la loro visione dei neuroni artificiali, e Turing aveva anticipato il concetto di ‘macchine pensanti’, mancava ancora un elemento cruciale: trasformare queste idee visionarie in una disciplina scientifica vera e propria. Fu una conferenza estiva del 1956, al Dartmouth College nel New Hampshire, a compiere questo passo decisivo. L’iniziativa venne promossa da John McCarthy, giovane professore (… di matematica, guarda un pò), insieme a Marvin Minsky, Claude Shannon e Nathaniel Rochester (*1): quattro tra le menti più brillanti dell’epoca. Ebbene, fu proprio in quella sede che il termine ‘Intelligenza Artificiale’, coniato nel 1955 da McCarthy, venne adottato ufficialmente e definito come la capacità delle macchine di svolgere compiti caratteristici dell’intelligenza umana.

La conferenza rappresentò, come è facile immaginare, un momento fondativo: per la prima volta, ricercatori provenienti da discipline diverse, matematica, neuroscienze, psicologia e informatica, si ritrovarono attorno a un obiettivo comune. Del resto l’obiettivo di istituire una nuova disciplina scientifica non era da poco.
Occorre inoltre ricordare che tra le proposte più ‘concrete’ presentate nel corso dell’incontro spiccò il ‘Logic Theorist’ di Allen Newell e Herbert Simon: programma capace di dimostrare teoremi matematici, considerato da molti il primo vero software di Intelligenza Artificiale della storia.
Un inizio straordinario, non c’è dubbio, che avrebbe aperto una stagione di grande entusiasmo e altrettanto grandi aspettative per una nuova, affascinante disciplina.

Nota:
*1: McCarthy J. et al., “A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence”, 1955.

1956

La scommessa (persa) di Dartmouth: un’estate per creare l’IA.

La scommessa (persa) di Dartmouth: un’estate per creare l’IA.

C’è un dettaglio interessante della Conferenza di Dartmouth che, a distanza di quasi settant’anni, fa sorridere. Occorre infatti ricordare che, nella proposta originale redatta da McCarthy e colleghi (*1), gli scienziati dichiararono che i progressi più significativi nel campo dell’Intelligenza Artificiale sarebbero stati raggiunti nel corso di un’estate di lavoro. Una sola estate … per risolvere uno dei problemi più complessi che la mente umana avesse mai affrontato! Da non crederci.

In realtà ci sarebbero voluti quasi settant’anni … senza dimenticare che ‘il meglio’, probabilmente, deve ancora venire.
Quest’aneddoto la dice lunga sull’entusiasmo, condito da un po’ di ingenuità, di quegli straordinari pionieri, anche se esiste un’altra lettura: spesso le più grandi rivoluzioni nascono proprio da chi ancora non sa quanto sia difficile ciò che l’attende.

Nota:
*1: McCarthy J. et al., “A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence”, 1955.

1956

I primi passi: l’approccio ‘se … allora’.

I primi passi: l’approccio ‘se … allora’.

Dalla metà degli anni Cinquanta fino agli anni Ottanta, il paradigma dominante per il funzionamento dell’Intelligenza Artificiale fu quello che oggi chiamiamo ‘approccio simbolico’ o ‘deterministico’: la macchina seguiva regole predefinite dall’uomo, del tipo “se accade X, allora fai Y” (“if … then”). Un’idea apparentemente semplice, che però all’epoca rappresentava una svolta concettuale enorme: per la prima volta, infatti, si cercava di tradurre in linguaggio matematico porzioni di ragionamento umano … affidandoli a una macchina! I ricercatori erano fermamente convinti che, moltiplicando e raffinando queste regole, si sarebbe potuto costruire uno strumento capace di replicare qualsiasi forma di intelligenza umana. Un obiettivo notevole, sostenuto peraltro da risultati iniziali decisamente incoraggianti.
Il limite strutturale di questo approccio, però, a ben vedere, era già identificabile: le macchine si limitavano infatti a fare ciò che l’uomo le aveva programmate … ma nulla di più! E il mondo reale, con tutta la sua complessità e imprevedibilità, si sa che  ben difficilmente può essere confinato in un insieme finito di regole.

1950/80

ELIZA: il primo chatbot … che ingannò il mondo!

ELIZA: il primo chatbot … che ingannò il mondo!

Nel 1966, un informatico tedesco naturalizzato americano di nome Joseph Weizenbaum, ricercatore presso il MIT di Boston, creò qualcosa di straordinario: ciò che oggi viene unanimemente considerato il primo chatbot della storia dell’Intelligenza Artificiale, battezzato ‘ELIZA’ (*1).
Va detto, per onestà storica, che Weizenbaum non aveva affatto intenzione di creare un chatbot: il suo obiettivo era piuttosto di costruire uno strumento di ricerca sulla comunicazione tra esseri umani e macchine.
L’effetto che ottenne, però, andò ben oltre le sue aspettative.
Il programma era concettualmente semplice:

analizzava le frasi dell’utente alla ricerca di parole chiave predefinite e le riformulava sotto forma di domande, simulando una conversazione con uno psicoterapeuta. Nulla di più. Eppure, nonostante questa semplicità strutturale, ELIZA produsse un effetto straordinario e del tutto inatteso: molti utenti svilupparono un autentico legame emotivo con il programma, convinti di interagire con una presenza capace di comprenderli davvero. La stessa segretaria di Weizenbaum, pur sapendo perfettamente come funzionasse il sistema, arrivò a chiedere al suo creatore di lasciare la stanza per poter conversare con ELIZA in privato! (*2). Un episodio emblematico, che la dice lunga sia sulla natura umana, sia su quella dell’Intelligenza Artificiale, individuando un fenomeno psicologico oggi ben documentato: l’ ‘effetto ELIZA’, ovvero la tendenza degli esseri umani ad attribuire comprensione ed empatia a sistemi che, in realtà, si limitano a elaborare simboli secondo regole prestabilite. Effetto che, come avrebbero dimostrato i decenni successivi, non avrebbe smesso di manifestarsi.

Note:
*1: Weizenbaum J., “ELIZA: A Computer Program for the Study of Natural Language Communication Between Man and Machine”, Communications of the ACM, gennaio 1966.
*2: Weizenbaum J., Computer Power and Human Reason: From Judgment to Calculation, W.H. Freeman & Co., San Francisco, 1976.

1966

Il primo ‘inverno dell’IA’: quando i sogni si scontrarono con la realtà.

Il primo ‘inverno dell’IA’: quando i sogni si scontrarono con la realtà.

Verso la metà degli anni Settanta, l’entusiasmo che aveva animato i primi decenni della storia dell’Intelligenza Artificiale si scontrò bruscamente con una realtà difficile da ignorare: i computer disponibili non erano sufficientemente strutturati, e soprattutto potenti, per gestire un software in grado di interpretare compiutamente la complessità e l’imprevedibilità del mondo reale. Le promesse non mantenute, quindi, si accumularono … e con esse la frustrazione dei finanziatori. Non a caso nel 1974, DARPA, la principale agenzia di ricerca del Dipartimento della Difesa americano, tagliò drasticamente i fondi destinati allo sviluppo dell’IA (*1).

Seguirono anni di stagnazione: laboratori ridimensionati, programmi di dottorato svuotati, ricercatori costretti a reinventarsi in altri campi. Il termine stesso, ‘Intelligenza Artificiale’, divenne quasi tossico, fonte di sospetto nell’ambito delle proposte di finanziamento … tanto che molti studiosi iniziarono a usare eufemismi (*2), pur di non menzionarla direttamente. Fu il primo ‘AI Winter’, ovvero il primo lungo inverno dell’Intelligenza Artificiale. Non sarebbe stato l’ultimo.

Note:
*1: Lighthill J., “Artificial Intelligence: A General Survey”, Science Research Council, 1973.
*2: Eufemismi come ‘informatics’ (‘informatica’) o ‘computational intelligence’ (‘intelligenza computazionale’).

1974

Sistemi ‘Esperti’: la rivincita dell’approccio ‘simbolico’.

Sistemi ‘Esperti’: la rivincita dell’approccio ‘simbolico’.

Nonostante il repentino calo dell’attenzione nei confronti dell’Intelligenza Artificiale, non a caso definito ‘inverno dell’IA’  (‘AI Winter’), un cerchio ristretto di ricercatori non smise comunque di lavorare. Per questo motivo, negli anni Ottanta, la nuova tecnologia tornò a far parlare di sé grazie a una nuova applicazione dell’approccio simbolico: si trattava dei cosiddetti ‘Sistemi Esperti’.
L’idea che stava alla base della loro creazione era semplice: invece di cercare di replicare l’intelligenza umana per intero, perché non concentrarsi su domini specifici, codificando conoscenze molto specialistiche di un umano grazie a un insieme limitato (ma non per questo esiguo) di regole ‘se … allora’ (‘if … then’)?

Il risultato furono sistemi molto competenti, ma solo in singoli ambiti, come le diagnosi mediche, la configurazione di computer, analisi di vario tipo e molto altro ancora.
Presso l’Università di Stanford, ad esempio, fu sviluppato ‘MYCIN’ (*1), capace di diagnosticare infezioni batteriche e suggerire terapie antibiotiche con una precisione paragonabile a quella di un medico (*2).
‘XCON’, realizzato da John McDermott della Carnegie Mellon University per Digital Equipment Corporation, selezionava i componenti necessari all’assemblaggio di sistemi informatici personalizzati  (*3).
Una ripartenza incoraggiante, che portò le grandi aziende e persino i governi a investire di nuovo nel settore. Ma questo rinnovato entusiasmo dovette, di lì a poco e ancora una volta, scontrarsi con una realtà fatta di computer ancora troppo poco potenti, e sistemi incapaci di adattarsi a situazioni impreviste.

Note:
*1: Shortliffe E.H., “Computer-Based Medical Consultations: MYCIN”, Elsevier, 1976. 
*2: MYCIN non fu mai adottato nella pratica clinica per ragioni legali ed etiche;
*3: McDermott J., “R1: A Rule-Based Configurer of Computer Systems”, Artificial Intelligence, 1982.

1980

Dreyfus: il filosofo che osò ‘sfidare’ l’IA.

Dreyfus: il filosofo che osò ‘sfidare’ l’IA.

Nel 1972, il filosofo Hubert Dreyfus pubblicò ‘What Computers Can’t Do’ (*1), quello che, di fatto, era un attacco frontale all’Intelligenza Artificiale: nel libro sosteneva infatti che non sarebbe mai stato possibile replicare l’intelligenza umana, fondata su intuizione, corpo ed esperienza vissuta … non su simboli e regole. La reazione della comunità scientifica fu decisamente fredda: alcuni dissero che le sue critiche andavano semplicemente ignorate, mentre i colleghi di Dreyfus al MIT arrivarono ad evitarlo in pubblico. Eppure, col tempo, diverse tra le sue intuizioni si sarebbero rivelate sorprendentemente fondate.

*1: Dreyfus H.L., “What Computers Can’t Do”, Harper & Row, 1972.

1972

Secondo ‘inverno dell'IA’: il ritorno di vecchi problemi.

Secondo ‘inverno dell'IA’: il ritorno di vecchi problemi.

Tra la fine degli anni Ottanta e i primi anni Novanta, l’Intelligenza Artificiale attraversò una seconda fase di crisi profonda. I Sistemi Esperti, pur avendo dimostrato risultati concreti in ambiti ristretti, rivelarono progressivamente i loro limiti strutturali: costosi da costruire e mantenere, incapaci di apprendere dall’esperienza e quindi di far fronte a qualsiasi situazione non prevista dalle loro rigide regole. I finanziamenti, vitali per la ricerca, furono nuovamente ritirati, le aziende specializzate chiusero i battenti e i professionisti del settore furono costretti verso altri ambiti.
Questo secondo ‘AI Winter’ si protrasse fino ai primi anni Novanta (*1), risultando ancora più lungo e devastante del primo.

Eppure, anche questa volta, una minoranza silenziosa di ricercatori continuò a lavorare, quasi nell’ombra, convinta che la strada giusta non fosse quella delle regole predefinite, ma qualcosa di radicalmente diverso: insegnare alle macchine ad imparare dall’esperienza, proprio come fanno gli esseri umani.

Nota:
*1: AI winter, Wikipedia.

1980/90

Il Giappone scommette tutto sull'IA … e perde.

Il Giappone scommette tutto sull'IA … e perde.

Nei primi anni Ottanta, mentre in Occidente i Sistemi Esperti raccoglievano i primi, insperati successi commerciali, il Giappone decise di rischiare, giocando una partita ancora più ambiziosa. Era il 1982 quando il Ministero del Commercio Internazionale e dell’Industria giapponese (MITI) lanciò il cosiddetto ‘Progetto Fifth Generation’:

un programma decennale da circa 400 milioni di dollari (*1) con un obiettivo dichiarato straordinariamente ambizioso: costruire entro il 1992 computer capaci di ragionare, comprendere il linguaggio naturale e risolvere problemi complessi come esseri umani.
La reazione dei paesi occidentali fu di immediato allarme, tanto che Stati Uniti e Regno Unito avviarono in fretta programmi di ricerca analoghi (*2).
Dieci anni dopo, nel 1992, il ‘Fifth Generation’ fu silenziosamente abbandonato, senza aver raggiunto nessuno degli obiettivi prefissati. Un fallimento clamoroso, che contribuì in modo determinante ad alimentare lo scetticismo del secondo AI Winter.

Note:
*1: Fifth Generation Computer Systems, Wikipedia.
*2: Gli USA risposero con la ‘Strategic Computing Initiative’, il Regno Unito con il ‘Progetto Alvey’, entrambi lanciati nei primi anni Ottanta.

1982

Dall’approccio ‘simbolico’ a quello ‘statistico’, un passaggio fondamentale per l’IA.

Dall’approccio ‘simbolico’ a quello ‘statistico’, un passaggio fondamentale per l’IA.

Per decenni, l’Intelligenza Artificiale aveva tentato di replicare il ragionamento umano attraverso regole predefinite: ‘se accade X, allora fai Y’ (‘if … then’). Un approccio che aveva prodotto risultati notevoli, ma in ambiti ristretti, rivelandosi quindi strutturalmente incapace di affrontare la complessità del mondo reale.
Come sarebbe stato possibile, in questo modo, riconoscere un cane all’interno di una fotografia, capire il senso di una frase un po’ ambigua o, ancora, guidare un’automobile in una strada affollata? Nessun insieme finito di regole scritte dall’uomo sarebbe mai stato sufficiente.
La svolta concettuale arrivò negli anni Novanta, quando una parte crescente della comunità scientifica iniziò ad abbracciare un paradigma radicalmente diverso: l’approccio statistico.

Invece di istruire le macchine con regole esplicite, si trattava di esporle a enormi quantità di esempi, lasciandole scoprire autonomamente schemi e correlazioni. Un sistema addestrato su milioni di fotografie avrebbe imparato a riconoscere un cane, senza che nessuno gli avesse mai spiegato cosa fosse.
Il cambio di prospettiva fu profondo e indubbiamente decisivo: le macchine da quel momento in poi non sarebbero più state ‘programmate per pensare’, ma ‘addestrate per imparare’.

1990

Deep Blue, il ‘canto del cigno’ dell'approccio simbolico.

Deep Blue, il ‘canto del cigno’ dell'approccio simbolico.

Nel 1997, mentre il mondo dell’Intelligenza Artificiale pativa ancora le conseguenze del secondo ‘inverno dell’IA’ (‘AI Winter’), IBM realizzò qualcosa che riuscì ancora a stupire: ‘Deep Blue’, un sistema ancora basato sul ‘vecchio’ approccio simbolico (‘se … allora’) … ma portato all’estremo, grazie all’impiego di quella che, per il tempo, era una enorme capacità di calcolo. Ebbene, questo ‘prodigio della tecnica’, applicato al gioco degli scacchi, riuscì a sconfiggere nientemeno che Garry Kasparov, il campione mondiale allora in carica, in una storica sfida in sei partite (*1).

Era la prima volta nella storia che una macchina riusciva a battere un giocatore umano (tra l’altro, il più forte!) in una disciplina considerata al vertice assoluto del ragionamento strategico.
Il vero segreto di Deep Blue, a dirla tutta, non era l’intelligenza nel senso stretto del termine ma la capacità di analizzare fino a 200 milioni di posizioni al secondo, applicando regole predefinite in base a un’enorme base dati costituita da partite storiche.
‘Forza bruta computazionale’, insomma, non vero apprendimento né tantomeno genuina iniziativa. Eppure … il risultato fu dirompente, dimostrando al mondo intero che, combinando grandi quantità di dati, algoritmi sofisticati e un’appropriata potenza nell’elaborazione, le macchine sarebbero state in grado di superare gli esseri umani anche nei compiti più complessi.
Un’indicazione che, di lì a pochi anni, avrebbe cambiato per sempre la storia dell’Intelligenza Artificiale.

Nota:
*1: IBM, Deep Blue.

1997

Le reti neurali: una grande idea … in attesa del suo momento.

Le reti neurali: una grande idea … in attesa del suo momento.

Le ‘reti neurali artificiali’, sistemi computazionali ispirati al funzionamento del cervello umano (*1), rappresentarono una tra le più importanti applicazioni pratiche del nuovo ‘approccio statistico’ nell’IA.
La loro ideazione aveva radici profonde, risalendo agli studi di Warren McCulloch e Walter Pitts del 1943, ma per decenni erano rimaste confinate alla pura teoria, poiché troppo esigenti in termini di dati e potenza di calcolo.
Una prima svolta arrivò nel 1986, quando Geoffrey Hinton, insieme a David Rumelhart e Ronald Williams, sviluppò la ‘backpropagation’: un metodo che permetteva a queste reti di imparare dai propri errori in modo automatico, migliorando progressivamente le prestazioni (*2), un po’ come fa un bambino che impara a camminare.

Nonostante l’importanza della scoperta, i risultati concreti tardarono ad arrivare a causa dei persistenti limiti degli elaboratori dell’epoca.
Fu solo verso la fine degli anni Novanta che le condizioni cominciarono finalmente a cambiare: i computer diventarono sempre più potenti e internet iniziò a mettere a disposizione una quantità di dati impensabile fino a poco tempo prima.
La rivoluzione dell’IA, di cui le reti neurali sarebbero state uno dei principali motori, si stava avvicinando.


Note:
*1: In sostanza, un software capace di apprendere dall’esperienza, senza dover essere programmato esplicitamente per ogni singolo compito.
*2: Rumelhart D., Hinton G., Williams R., “Learning Representations by Back-propagating Errors”, Nature, 1986. 

1986

2012: l’esplosione del ‘Deep Learning’ e la nascita dell’IA moderna.

2012: l’esplosione del ‘Deep Learning’ e la nascita dell’IA moderna.

A partire dai primi anni del Duemila una nuova tecnica avrebbe rivoluzionato l’Intelligenza Artificiale, portandola a un livello di potenza e versatilità mai raggiunto prima. Stiamo parlando del ‘Deep Learning’, ovvero l’ ‘apprendimento profondo’ (*1).
In sostanza il Deep Learning simula’ il ragionamento umano e, facendo uso di ‘reti neurali’ (software computazionali che replicano il comportamento dei neuroni biologici), elabora informazioni in modo progressivamente più complesso e astratto, avvicinandosi in questo modo al funzionamento del cervello umano.
A rendere possibile il funzionamento di questo complesso meccanismo fu la convergenza di due fattori, fino ad allora decisamente carenti, ovvero l’introduzione di computer sempre più potenti (*2) e la disponibilità di enormi quantità di dati, presenti in internet, necessari per ‘addestrare’ (‘far imparare’, come un bambino) i nuovi modelli.

Fu in un contesto del genere che, nel 2012, il professor Geoffrey Hinton e due suoi studenti, Ilya Sutskever e Alex Krizhevsky, parteciparono a ImageNet: competizione internazionale dedicata al riconoscimento di immagini (*3). Il loro modello, chiamato AlexNet e basato proprio sul ‘deep learning’, sbaragliò la concorrenza con un margine notevole, riducendo il tasso di errore dell’ 11% (circa), rispetto al secondo classificato (*4).
Un risultato sotto molti aspetti inaspettato che lasciò il mondo scientifico a bocca aperta: l’intuizione ‘profonda’ di Hinton aveva appena dimostrato di poter fare ciò che nessun altro approccio all’IA era riuscito a fare prima.


Note:
*1: Nel 2006 Geoffrey Hinton, informatico e psicologo cognitivo britannico-canadese, aveva introdotto il termine e il concetto di ‘Deep Learning’ con un articolo fondamentale sulle reti neurali profonde;
*2: I computer diventarono più potenti grazie alle GPU: i processori delle schede grafiche originariamente sviluppate per l’industria videoludica e rivelatesi straordinariamente efficaci per addestrare questi sistemi.
*3: ImageNet Large Scale Visual Recognition Challenge.

2012

L’era ‘generativa’: quando l’IA imparò a creare.

L’era ‘generativa’: quando l’IA imparò a creare.

Dopo la svolta del 2012, il mondo dell’Intelligenza Artificiale accelerò in modo vertiginoso. I modelli basati sul Deep Learning diventarono progressivamente più sofisticati, fino a raggiungere un traguardo che fino a pochi anni prima sarebbe sembrato pura fantascienza: la capacità di generare, autonomamente, contenuti originali.
La pietra angolare di questo nuovo edificio fu posata nel 2014, quando Ian Goodfellow, ricercatore dell’Università di Montreal, introdusse le ‘GAN’, ‘Generative Adversarial Networks’ (*1). La sua idea era semplice ma estremamente efficace: due reti neurali sarebbero state poste in competizione tra loro, una incaricata di generare immagini, l’altra di individuarne i difetti e le imperfezioni. A forza di sfidarsi, la prima avrebbe imparato a produrre immagini sempre più realistiche, fino a renderle indistinguibili da quelle reali.

Le GAN aprirono quindi una porta che non sarebbe più stata richiusa: nel giro di pochi anni, l’IA avrebbe imparato a produrre immagini fotorealistiche (*2), comporre musica originale e generare video … a partire da una semplice descrizione testuale!
L’Intelligenza Artificiale aveva smesso di essere uno strumento puramente analitico diventando, a tutti gli effetti, creativa.

Note:
*1: Goodfellow I. et al., “Generative Adversarial Networks”, NeurIPS, 2014. 
*2: Con sistemi come DALL-E (2021), Midjourney (2022) e Stable Diffusion (2022).

2014

L’avvento degli LLM e ChatGPT, quando l’IA imparò a ‘parlare’.

L’avvento degli LLM e ChatGPT, quando l’IA imparò a ‘parlare’.

Parallelamente alla rivoluzione rappresentata dalla generazione di contenuti multimediali, l’Intelligenza Artificiale generativa stava compiendo passi da gigante anche nel campo del linguaggio.
I protagonisti di questa specifica evoluzione furono i cosiddetti ‘Large Language Models’, o ‘LLM’: modelli linguistici di grandi dimensioni, appunto, poiché addestrati su quantità colossali di testo, capaci quindi di generare linguaggio scritto con una coerenza e una naturalezza sorprendenti in risposta agli input dell’utente umano. Anche in questo caso si trattava, a tutti gli effetti, di Intelligenza Artificiale generativa, applicata però al testo, piuttosto che alle immagini o alla musica.
Di fondamentale importanza, in questo quadro, fu la realizzazione dei primi modelli GPT da parte di OpenAI, società fondata nel 2015 da Sam Altman e Elon Musk (tra gli altri). Modelli che, nel novembre del 2022, avrebbero portato al lancio di ‘ChatGPT’ (*1): il primo sistema di Intelligenza Artificiale con cui chiunque poteva conversare liberamente, in linguaggio naturale, senza alcuna competenza tecnica. In soli due mesi, ChatGPT avrebbe raggiunto i 100 milioni di utenti (*2), diventando il prodotto tecnologico a crescita più rapida della storia.

2022

‘Transformers’, il motore degli LLM.

‘Transformers’, il motore degli LLM.

Il funzionamento degli LLM, in grado di sfoggiare capacità conversazionali a dir poco sorprendenti, è strettamente legato a un’innovativa architettura computazionale introdotta nel 2017 da un gruppo di ricercatori di Google, vale a dire i cosiddetti ‘Transformers’ (*1).
Prima della loro comparsa, infatti, i modelli linguistici elaboravano il testo sequenzialmente, parola dopo parola, come un lettore che scorre progressivamente le pagine di un libro dall’inizio alla fine. Un approccio decisamente troppo lento e limitato, incapace di cogliere con facilità relazioni tra parole distanti nel contenuto.

I Transformers risolsero questo problema, elaborando lintera sequenza testuale simultaneamente ed attribuendo, contestualmente, a ciascun termine, un peso specifico in relazione a tutti gli altri. Questo meccanismo, chiamato ‘attention’ (*2), permise ai modelli linguistici di comprendere il contesto rapidamente ed in modo profondo e articolato, rendendo possibile quella naturalezza nella comprensione degli input e nella generazione delle risposte che tanto li caratterizza.

Note:
*1: Vaswani A. et al., “Attention Is All You Need”, NeurIPS, 2017.
*2: Il meccanismo dell’ ‘attention’ consente al modello di pesare l’importanza relativa di ogni parola rispetto alle altre nel contesto della frase.

2017

La storia dell’Intelligenza Artificiale: un futuro tutto da scrivere.

La storia dell’Intelligenza Artificiale: un futuro tutto da scrivere.

La storia dell’Intelligenza Artificiale è, a ben vedere, il percorso più o meno accidentato di un’idea decisamente audace e visionaria che ha necessitato di quasi un secolo per concretizzarsi. Dalle prime speculazioni teoriche di McCulloch e Pitts negli anni Quaranta, passando per l’entusiasmo pionieristico di Dartmouth, fino ai lunghi ‘inverni’ e all’esplosione del Deep Learning, ognuna di queste tappe ha contribuito a realizzare una tecnologia in grado di segnare profondamente il presente e il futuro dell’umanità.
Ma dove ci porterà esattamente tutto questo? La risposta onesta è che nessuno lo sa con certezza, anche se molti esperti, non senza una certa preoccupazione, ci stanno pensando. Quello che invece sappiamo per certo è che il ritmo dell’innovazione non accennerà a rallentare, tutt’altro, poiché l’evoluzione dell’AI dipenderà sempre più dall’IA stessa e sempre meno dall’intervento umano.

IntelliGuide Logo.

Le immagini presenti in questa pagina web sono state realizzate impiegando strumenti di Intelligenza Artificiale generativa.