ADSENSE
|
Questo post é stato letto 40 volte!
OpenAI ha svelato Jalapeño, il suo primo chip intelligenza artificiale jalapeño, sviluppato in collaborazione con Broadcom.
Questo annuncio segna un passo significativo nell’evoluzione dell’infrastruttura che supporta servizi come ChatGPT e Codex.
L’obiettivo principale è ridurre la dipendenza dalle GPU NVIDIA e ottimizzare l’efficienza computazionale.
La crescente domanda di potenza di calcolo per i modelli linguistici ha spinto le principali aziende AI a investire in processori personalizzati per contenere i costi e garantire una maggiore autonomia tecnologica.
Con Jalapeño, OpenAI si unisce a questo gruppo di innovatori.
Cos’è jalapeño e il suo ruolo nell’inferenza AI
Ottimizzazione per i grandi modelli linguistici
Jalapeño è un ASIC (Application-Specific Integrated Circuit) progettato specificamente per l’inferenza AI.
A differenza delle GPU general purpose, un ASIC è ottimizzato per eseguire un insieme limitato di operazioni con un’efficienza energetica superiore.
Per OpenAI, il chip è stato perfezionato per gestire i carichi di lavoro tipici dei grandi modelli linguistici.
L’inferenza, ossia la fase in cui il modello elabora le richieste degli utenti e genera risposte, richiede enormi quantità di calcolo, distribuite su milioni di query giornaliere.
Questa fase rappresenta una delle maggiori voci di costo per i fornitori di AI, rendendo l’hardware su misura una soluzione strategica per ridurre la dipendenza dalle GPU commerciali.
Il processore è stato sviluppato in circa nove mesi, con l’ausilio di strumenti basati sull’AI per accelerare le fasi di progettazione e verifica.
La produzione è affidata a TSMC, leader mondiale nella produzione di semiconduttori avanzati, mentre l’integrazione nei server e nei rack per i datacenter è curata da Celestica.
Al momento, non è prevista la commercializzazione di Jalapeño a clienti esterni.
Prestazioni, efficienza e confronto con le soluzioni esistenti
Vantaggi in termini di efficienza energetica
Hock Tan, amministratore delegato di Broadcom, ha affermato che Jalapeño raggiunge livelli di prestazioni comparabili alle piattaforme NVIDIA Blackwell e alle TPU di Google in specifici scenari di inferenza.
Queste affermazioni richiedono ulteriori verifiche tramite benchmark indipendenti.
Il dato più rilevante emerso dai primi test di laboratorio riguarda l’efficienza energetica: OpenAI sostiene un miglioramento del performance per watt rispetto ad alcune soluzioni attuali nei datacenter AI.
Quando un servizio gestisce centinaia di milioni di richieste al giorno, anche un piccolo incremento nell’efficienza si traduce in risparmi economici considerevoli e una riduzione del fabbisogno energetico complessivo.
Jalapeño non sostituirà immediatamente le GPU NVIDIA nell’infrastruttura di OpenAI, che continuerà a utilizzare hardware di diversi fornitori.
Tuttavia, le prime unità stanno già eseguendo carichi reali nei laboratori, inclusi workload associati a GPT-5.3-Codex-Spark.
Roadmap e le sfide future
La distribuzione su larga scala di Jalapeño è prevista tra la fine del 2026 e il 2027, con l’obiettivo di supportare diversi gigawatt di capacità computazionale.
Le sfide non mancano: i costi di sviluppo dei semiconduttori avanzati continuano a crescere, e la disponibilità di HBM (High Bandwidth Memory) rimane inferiore alla domanda globale.
OpenAI descrive Jalapeño come il primo elemento di una famiglia di processori destinata a evolversi nel tempo.
Se il progetto manterrà le promesse, l’azienda otterrà un controllo più diretto sulla propria infrastruttura, riducendo la dipendenza dai cicli tecnologici dei grandi produttori di GPU.
Questo post é stato letto 40 volte!