NPU, cos’è? Scopriamo il chip progettato per gestire l’Intelligenza Artificiale direttamente sui nostri dispositivi, senza accedere alle risorse esterne del ‘cloud’: caratteristica che lo rende sia particolarmente efficiente da un punto di vista energetico, sia rispettoso della privacy, non trasmettendo dati sensibili. Buona lettura!

Negli ultimi anni il mondo dell’hardware ha dato il benvenuto un nuovo protagonista: la cosiddetta NPU, acronimo di ‘Neural Processing Unit’, vale a dire Unità di Elaborazione Neurale. Nome decisamente impegnativo che, in sostanza, indica un chip altamente specializzato, progettato per eseguire i calcoli matematici che stanno alla base delle reti neurali artificiali, a loro volta ‘motore’ dell’Intelligenza Artificiale (*1). A differenza delle altre componenti hardware, come il processore centrale o la scheda grafica, la NPU non è uno strumento generalista, capace quindi di affrontare qualsiasi tipo di compito: è, al contrario, un esperto di altissimo livello, ottimizzato esclusivamente per il particolare tipo di elaborazione legata all’IA. Com’è facile immaginare, questa estrema focalizzazione se da un lato è sicuramente limitante, dall’altro le consente di svolgere determinati compiti in modo molto più rapido ed efficiente rispetto a qualsiasi soluzione non dedicata. Originariamente confinata ai grandi data center e ai laboratori di ricerca, la NPU ha progressivamente trovato spazio nei dispositivi di uso quotidiano: prima negli smartphone, poi nei tablet e, più di recente, nei Personal Computer.
Un percorso che ha trasformato quella che era una tecnologia di nicchia in un componente destinato a diventare parte integrante di ogni dispositivo ‘intelligente’.
*1: IBM, “Cos’è una NPU?”.


Quando si parla di NPU, è facile imbattersi in una particolare unità di misura poco familiare ai non addetti ai lavori, ovvero i ‘TOPS’, acronimo di ‘Trillion Operations Per Second’, in Italiano ‘mille miliardi di operazioni al secondo’. Un numero del genere, senza dubbio intimidante, rappresenta il parametro generalmente usato per valutare la potenza di calcolo di un chip dedicato all’IA: più alto è il valore, più operazioni il chip riuscirà a eseguire in parallelo ogni singolo secondo.
Facciamo qualche esempio concreto: il Neural Engine del chip Apple M4 raggiunge i 38 TOPS (*1), mentre il processore Qualcomm Snapdragon X Elite arriva a ben 45 TOPS (*2).
Microsoft, dal canto suo, per i propri PC Copilot+, ha fissato a 40 TOPS la soglia minima richiesta per accedere alle funzionalità di Intelligenza Artificiale avanzate (*3). Valori che, fino a non troppo tempo fa, erano appannaggio esclusivo dei data center più performanti: ebbene, oggi li ritroviamo nei laptop che portiamo quotidianamente in borsa!
Note:
*1: Apple, “M4 chip”;
*2: Qualcomm, “Snapdragon X Elite Product Brief”;
*3: Microsoft, “Windows 11 Specifications”.

Per iniziare a comprendere davvero lo specifico ruolo di una NPU, è utile collocarla nel contesto più ampio dell’hardware che ‘muove’ i nostri Personal Computers. Cominciamo con l’evidenziare che, in ognuno di essi (o quasi), il lavoro è ripartito tra più componenti, ciascuna progettata per eccellere in un ambito ben definito.
La ‘CPU’, ovvero l’unità di elaborazione centrale, è il processore, per così dire, ‘tuttofare’ che tra i suoi vari compiti gestisce il sistema operativo, esegue i programmi e coordina le attività della macchina. È precisa e capace di affrontare pressoché qualsiasi tipo di operazione, lavorando principalmente in modo sequenziale, processando quindi le istruzioni una dopo l’altra.
La ‘GPU’ è invece il chip nato per accelerare il rendering grafico nei videogiochi, che si è rivelato inaspettatamente prezioso anche per gli impegnativi carichi di lavoro legati al funzionamento dell’IA. Tutto ciò grazie alla sua architettura destinata ai calcoli ‘in parallelo’, composta com’è da migliaia di core che operano, appunto, in contemporanea.
In questo scenario, la ‘NPU’ ha trovato un ruolo tutto suo e complementare: non la potenza bruta della GPU, né la versatilità della CPU, ma la capacità di eseguire i calcoli propri delle reti neurali in modo rapido, efficiente e soprattutto con un consumo energetico contenuto (*1).
Tre chip, tre specializzazioni, una sola squadra.
Nota:
*1: IBM, “NPU, GPU e CPU a confronto”.

A differenza della CPU, ‘centro nevralgico’ dei nostri Personal Computers, che gestisce un gran numero di compiti diversi necessari al suo stesso funzionamento, una ‘NPU’ è ottimizzata per uno solo, legato a una specifica tipologia di computo matematico: la cosiddetta ‘operazione MAC’, acronimo di ‘Multiply-Accumulate’, ovvero ‘moltiplicazione e accumulazione’. In sostanza, la NPU prende due numeri, li moltiplica tra loro e aggiunge il risultato a un valore progressivo. Un passaggio in apparenza banale, che deve però essere ripetuto miliardi di volte al secondo, coinvolgendo enormi matrici di dati, rivelandosi assolutamente necessario per garantire l’effettiva funzionalità delle reti neurali artificiali.
Per rispondere a questa esigenza nel modo più performante possibile, la NPU è stata progettata adottando un’architettura particolare, distribuita su moltissimi nuclei computazionali elementari che lavorano in contemporanea, utilizzando una precisione aritmetica ridotta (tipicamente a 8 o 16 bit) che alleggerisce il carico computazionale senza compromettere la qualità delle risposte. È inoltre dotata di una memoria interna ad alta velocità che le permette di ‘trattare’ i dati evitando trasferimenti continui verso la RAM (la memoria principale) del dispositivo (*1).
Il risultato è un chip capace di gestire flussi di elaborazione sostenuti e intensivi con un’efficienza energetica che nessuna CPU o GPU tradizionali potrebbe garantire nello svolgere le medesime operazioni.
Nota:
*1: IBM, “Come funzionano le NPU?”.

Era il mese di settembre del 2017 quando Apple presentava l’iPhone X, dotato di un chip A11 Bionic che integrava, tra i primissimi dispositivi portatili al mondo, una componente dedicata esclusivamente all’Intelligenza Artificiale: il ‘Neural Engine’ (*1). Con i suoi due core e una capacità di 0,6 TOPS, era chiamato a gestire compiti allora del tutto nuovi per uno smartphone, come il riconoscimento del volto per il Face ID e i filtri in realtà aumentata degli Animoji.
Le prestazioni, ovviamente, erano lontane da quelle dei processori odierni, ma il principio alla base del nuovo hardware era senza dubbio rivoluzionario:
riservare alcuni elementi appositamente all’IA, anziché affidarsi alla CPU o alla GPU già presenti nel telefono.
Da quel momento, Apple non ha più smesso di investire in questa tecnologia: il Neural Engine del chip M4, lanciato nel 2024, raggiunge i 38 TOPS (*2), con una crescita di oltre sessanta volte in meno di un decennio.
Un percorso che ha trascinato l’intero settore, spingendo Intel, Qualcomm e AMD a seguire la stessa strada nei loro prodotti per Personal Computer.
Nota:
*1: Apple, comunicato stampa iPhone X.
*2: Apple, “M4 chip”.

Tra tutti gli indubbi vantaggi legati all’uso delle NPU, uno merita particolare attenzione: la privacy. Quando un’operazione legata all’Intelligenza Artificiale viene eseguita in locale dal nuovo chip, i propri dati non devono necessariamente ‘lasciare’ il dispositivo. Non vengono quindi inviati a server remoti, non transitano su reti esterne, né sono trasmessi a terzi.
Ciò vale, ad esempio, per le fotografie rielaborate dall’IA, per le trascrizioni di conversazioni private e per qualsiasi altro tipo di materiale riservato.
Nel contesto attuale, in cui la sensibilità verso la protezione delle informazioni personali è in costante crescita, si tratta di un beneficio concreto e di primaria importanza (*1).
Da questo punto di vista, quindi, la NPU non è solo uno strumento utile, che incrementa le prestazioni, ma è, anche e soprattutto, un mezzo di controllo sul proprio privato.

Sebbene sia indubbiamente utile comprendere come funziona una NPU, forse lo è ancora di più capire cosa, in concreto, questa tecnologia è in grado di fare per noi. Ben inteso, non tutti i dispositivi attualmente in circolazione ne sono provvisti, anche se è integrata in un numero sempre crescente tra i più nuovi. Stupisce inoltre pensare che molti utenti, pur beneficiando ogni giorno delle sue capacità … non lo sanno: si tratta infatti del ‘meccanismo magico’ che, ad esempio, sblocca lo smartphone tramite il riconoscimento del viso, che gestisce la sfumatura dello sfondo durante una videochiamata o che, infine, trascrive immediatamente ciò che viene detto.
Passando ai Personal Computer di ultima generazione dotati di NPU, quelli che Microsoft chiama ‘PC Copilot+’, le opportunità sono altrettanto concrete. È il caso di Windows 11, che mette a disposizione i ‘sottotitoli in tempo reale con traduzione automatica’: qualsiasi audio riprodotto (come quello di un video o di una riunione online), può essere trascritto e tradotto istantaneamente in qualsiasi lingua, senza connessione internet e senza inviare nulla al cloud (*1).
Chi vuole dare nuova vita alle proprie fotografie può usare la funzione ‘Restyle Image’ (dell’app ‘Foto’), trasformandole in immagini artistiche, applicando stili come l’acquerello (*2). L’app Paint, quella che tutti conoscono sin dai tempi di Windows 95, è stata infine arricchita da ‘Cocreator’: basta descrivere ciò che si vuole ottenere per generare illustrazioni originali, elaborate interamente in locale, dalla propria macchina (*3).
Le funzionalità sono in continua espansione, anche se il denominatore comune rimane lo stesso: grazie alla NPU operazioni che fino a poco tempo fa necessitavano di server remoti, oggi si possono portare a termine scollegati da essi, in modo rapido e soprattutto rispettoso della privacy.
Note:
*1: Microsoft, “Introducing Copilot+ PCs”;
*2: Microsoft, “Introducing Copilot+ PCs”;
*3: Microsoft, “Cocreator in Paint”;

Fino a poco tempo fa appannaggio di pochi dispositivi di fascia alta, la NPU sta rapidamente diventando una presenza fissa nel panorama dell’informatica moderna. Basti pensare che Intel ha già distribuito oltre 100 milioni di processori con NPU integrata (*1), mentre AMD e Qualcomm propongono soluzioni analoghe nei propri chip di ultima generazione. Microsoft ha accelerato questa transizione con i PC Copilot+, imponendo la soglia minima di 40 TOPS come requisito per accedere alle funzionalità IA avanzate di Windows 11 (*2). La NPU, insomma, sta percorrendo la stessa strada degli SSD (*3): da elemento opzionale a dotazione imprescindibile.
*1: PC Gamer, “Intel says it has shipped nearly 100 million AI PC processors”, gennaio 2026;
*2: Microsoft, “Windows 11 Specifications”;
*3: I ‘Solid State Drives’ (‘Unità a Stato Solido’), successori dei vecchi hard disk meccanici.

Nell’ambito dell’accesa diatriba sull’impatto ambientale dell’Intelligenza Artificiale, la NPU introduce un elemento positivo e non ancora abbastanza apprezzato. Un chip di questo genere impegna infatti tra i 5 e i 10 watt per gestire un task ‘leggero’ (*1) legato all’IA (*2), valore nettamente inferiore ai 30-40 watt che una GPU ‘locale’ richiederebbe per la medesima operazione … per non parlare del dispendio energetico dei data center quando tale elaborazione avviene in cloud.
Ciò vuol dire, in sostanza, che ogni qualvolta funzioni ‘avanzate’ sono eseguite, grazie a una NPU, direttamente sul proprio dispositivo anziché su server remoti, si contribuisce a contenere i consumi complessivi. Un dato non trascurabile che segna il futuro di questa nuova tecnologia.
*1: Per ‘task leggero’ si intende un’operazione come, ad esempio, il riconoscimento del viso, la trascrizione del parlato o la sfumatura dello sfondo nelle videochiamate;
*2: HP, “Why Everyone’s Talking About NPUs”;

La NPU è una tecnologia estremamente efficace e, non a caso, in rapida evoluzione. Se, in termini di velocità, il riferimento attuale è fissato a 40 TOPS (per i PC Copilot+ ), i chip di ultimissima generazione già lo superano: basti pensare che Intel Core Ultra Series 3 arriva fino a 50 TOPS (*1), AMD Ryzen AI 400 fino a 60 (*2) e Qualcomm Snapdragon X2 fino a 80 (*3).
Parallelamente a questa trasformazione dell’hardware, i modelli di Intelligenza Artificiale si stanno progressivamente riducendo nelle dimensioni, ancora più ottimizzati per girare direttamente sui dispositivi (PC, smartphones, etc.), senza dipendere dal cloud.
La traiettoria futura è quindi molto chiara: le NPU diventeranno sempre più potenti, il software le sfrutterà meglio e l’IA locale cesserà di essere una promessa per diventare una realtà consolidata.
Note:
*1: Intel, “CES 2026: Intel Core Ultra Series 3”;
*2: AMD, “CES 2026 Press Release”;
*3: Newegg Insider, “AI PC News from CES 2026”;
Le immagini presenti in questa pagina web sono state realizzate impiegando strumenti di Intelligenza Artificiale generativa.