AGI – Il rilascio di TurboQuant, il nuovo algoritmo di compressione per modelli linguistici di grandi dimensioni presentato da Google Research, pesa sul comparto dei semiconduttori perché punta a ridurre uno dei principali costi infrastrutturali dell’intelligenza artificiale generativa: la memoria necessaria durante l’inferenza, cioè nella fase in cui il modello produce risposte. TurboQuant, si legge nella nota del gruppo di Mountain View, è un sistema pensato per rendere l’IA meno costosa e più veloce.
Il software interviene su quella che può essere descritta come la memoria a breve termine del modello, cioè l’insieme di informazioni che il sistema deve conservare temporaneamente per mantenere il contesto e rispondere in modo coerente. Finora questo processo ha richiesto chip avanzati, grandi quantità di memoria e un elevato consumo di energia. Secondo Google, TurboQuant consente di comprimere queste informazioni di sei volte senza compromettere l’accuratezza dei risultati. Questo apre la strada all’esecuzione di modelli complessi su infrastrutture meno onerose e permette di gestire testi più lunghi con maggiore efficienza.
In termini industriali, la novità indica la possibilità di ottenere le stesse prestazioni con una quantità molto inferiore di risorse hardware, con effetti potenziali sui costi operativi, sui consumi energetici e sulla scalabilità dell’intelligenza artificiale. La mossa di Google si riflette subito sul mercato e viene letta come un nuovo segnale della spinta dei grandi fornitori cloud verso una maggiore integrazione verticale, con l’obiettivo di contenere i costi e rendere più efficiente l’esecuzione dei modelli.
Reazione del mercato asiatico
A Seul la reazione è stata pesante: il Kospi ha chiuso in calo del 3,35%, appesantito soprattutto dai due principali titoli del settore. SK Hynix, leader nelle memorie Hbm, ha perso il 6,23%, mentre Samsung Electronics ha ceduto il 4,71%. Sul comparto pesa il timore che l’ottimizzazione software, insieme allo sviluppo di chip proprietari come Axion, possa ridurre nel tempo la dipendenza da una crescita puramente quantitativa della capacità hardware. In altre parole, il mercato teme un rallentamento della domanda di componenti avanzati da parte dei grandi gruppi tecnologici.
Impatto sul mercato statunitense
Il clima di cautela si riflette anche sul comparto statunitense dei semiconduttori, dove in premarket scendono soprattutto i titoli più legati alla memoria e alla filiera produttiva: Micron perde il 3,39%, Sandisk il 3,49%, Western Digital l’1,70%, Lam Research il 2,27%, KLA l’1,39% e Applied Materials l’1,21%. In controtendenza si muove invece Arm Holdings, che guadagna il 16,37%, sostenuta dalle attese sulle royalties legate all’adozione dell’architettura Neoverse V2 da parte di Google.