Stati Uniti - Agenzia stampa Ekhbary
Innovazione nella Tecnologia di Memoria Promette di Abbattere la Barriera Prestazionale dell'IA
In uno sviluppo che potrebbe rivoluzionare l'intelligenza artificiale, un team di ricercatori dell'Università della California, San Diego (UCSD), ha svelato un progresso rivoluzionario nella memoria resistiva ad accesso casuale (RRAM). Questa innovazione affronta direttamente uno degli ostacoli più significativi che i moderni sistemi di IA devono affrontare: il famigerato "muro della memoria". Questo collo di bottiglia deriva dal considerevole tempo ed energia richiesti per spostare continuamente dati tra processori e memoria, anche per modelli di IA altamente ottimizzati.
L'ingegnosità della RRAM bulk 3D impilata sviluppata dal team UCSD risiede nella sua capacità di eseguire compiti computazionali direttamente all'interno delle celle di memoria stesse. Questo paradigma, spesso definito "calcolo in memoria" (in-memory computing), elimina la necessità di movimenti dati costanti ed energivori, aprendo la strada a una velocità ed efficienza senza precedenti nell'elaborazione dell'IA.
Leggi anche
Superare le Limitazioni della Memoria Tradizionale
Tradizionalmente, i dispositivi RRAM memorizzano dati alterando la loro resistenza elettrica. Tuttavia, le tecnologie RRAM convenzionali sono state spesso afflitte da instabilità e complessità, limitandone le applicazioni pratiche, in particolare in campi ad alta intensità di dati come l'IA. Un problema chiave della RRAM tradizionale è la sua dipendenza dalla formazione di "filamenti" conduttivi all'interno di un materiale resistivo. La creazione di questi filamenti richiede tipicamente alte tensioni, spesso incompatibili con i processi di fabbricazione standard del metallo-ossido-semiconduttore complementare (CMOS), ostacolando così un'integrazione senza soluzione di continuità nei moderni processori. Inoltre, il processo di formazione dei filamenti è intrinsecamente rumoroso e casuale, portando a imprecisioni nei dati, un grave svantaggio per i modelli di deep learning che dipendono da valori di peso precisi.
Per aggirare queste limitazioni, i ricercatori dell'UCSD, guidati dall'ingegnere elettrico Duygu Kuzum, hanno fondamentalmente riprogettato l'architettura RRAM. Invece di fare affidamento sulla formazione di filamenti, hanno sviluppato una nuova variante nota come "bulk RRAM". In questo design innovativo, un intero strato di materiale commuta tra stati di alta e bassa resistenza, piuttosto che formare filamenti localizzati. Questo approccio evita la necessità della formazione di filamenti ad alta tensione ed elimina la necessità di "transistor selettori" di isolamento che erano precedentemente necessari per l'isolamento delle celle nella RRAM tradizionale. Questa semplificazione facilita notevolmente il complesso processo di impilamento tridimensionale.
Innovazione nell'Impilamento 3D e nella Capacità di Archiviazione
Sebbene il concetto di bulk RRAM non sia del tutto nuovo, il gruppo UCSD ha ottenuto progressi significativi nella miniaturizzazione di questi dispositivi e nella loro integrazione in circuiti 3D funzionali. I ricercatori hanno ridotto con successo i dispositivi RRAM alla nanoscala, con dispositivi individuali che misurano solo 40 nanometri di diametro. Fondamentalmente, sono riusciti a impilare questi dispositivi bulk RRAM fino a otto strati. Ogni cella all'interno di questo stack a otto strati può rappresentare sei bit di dati, consentendole di contenere 64 diversi livelli di resistenza con un singolo impulso di tensione. Questo alto livello di precisione negli stati di resistenza è eccezionalmente difficile da ottenere con la RRAM tradizionale basata su filamenti.
Inoltre, i nuovi stack bulk RRAM operano nell'intervallo di resistenza dei megaohm (MΩ), un aumento significativo rispetto all'intervallo dei kiloohm (kΩ) tipico della RRAM basata su filamenti. La Dott.ssa Kuzum osserva che questa gamma di resistenza più elevata è particolarmente vantaggiosa per le operazioni parallele, migliorando ulteriormente l'efficienza del calcolo in memoria.
Applicazione nel Mondo Reale: Reti Neurali ad Apprendimento Continuo
Per dimostrare il potenziale della tecnologia, i ricercatori hanno costruito un array di memoria da 1 kilobyte utilizzando più stack bulk RRAM a otto strati, che, in modo notevole, non richiedevano transistor selettori. Questo array è stato poi testato con un algoritmo di apprendimento continuo, incaricato di classificare i dati provenienti da sensori indossabili, integrando continuamente nuove informazioni. Ad esempio, i dati di uno smartphone indossabile potrebbero essere utilizzati per determinare con precisione l'attività dell'utente, come stare seduti, camminare o salire le scale. I test hanno prodotto un impressionante tasso di accuratezza del 90%, un livello di prestazioni paragonabile a quello delle reti neurali implementate digitalmente.
La Dott.ssa Kuzum ritiene che questa tecnologia sia particolarmente adatta per i modelli di IA distribuiti su dispositivi edge, che necessitano di apprendere e adattarsi al proprio ambiente senza una connettività cloud costante. "Stiamo conducendo un'ampia caratterizzazione e ottimizzazione dei materiali per progettare un dispositivo specificamente ingegnerizzato per applicazioni di IA", ha affermato Kuzum.
Notizie correlate
- Studio: Scimmia Africana Contrae Mpox Dopo Aver Mangato Uno Scoiattolo Infetto
- Lo strumento AI OpenClaw cancella la casella di posta del direttore dell'allineamento AI di Meta nonostante i comandi di stop
- La Cina supera gli Stati Uniti per numero di miliardari grazie al boom di tecnologia e intelligenza artificiale
- Apple Maps Accelera l'Esperienza della Formula 1 con Guide Immersive sui Circuiti
- Elon Musk fonde xAI in SpaceX per creare un Sole senziente e diffondere la coscienza universale
Sfide Future e Prospettive Promettenti
Alec Talin, uno scienziato dei materiali presso i Sandia National Laboratories e ricercatore nel campo della bulk RRAM non coinvolto nello studio, ha descritto questo progresso nell'integrazione come un passo molto prezioso. Tuttavia, Talin ha evidenziato una potenziale sfida: la capacità di ritenzione dei dati per periodi prolungati, in particolare alle temperature elevate riscontrate negli ambienti operativi dei computer. Mentre il gruppo UCSD ha dimostrato diversi anni di ritenzione dei dati a temperatura ambiente, paragonabile alla memoria flash, le sue prestazioni a temperature operative più elevate rimangono oggetto di ulteriori indagini. "Questa è una delle principali sfide per questa tecnologia", ha commentato Talin, soprattutto per quanto riguarda le applicazioni edge.
Se gli ingegneri riusciranno a superare queste sfide, la tecnologia bulk RRAM potrebbe offrire notevoli vantaggi a tutti i tipi di modelli di IA. Il "muro della memoria" è diventato un ostacolo sempre più formidabile in questo decennio, poiché la memoria convenzionale fatica a tenere il passo con le crescenti esigenze dei modelli di IA su larga scala. Qualsiasi tecnologia che consenta al calcolo di avvenire direttamente all'interno della memoria offre una scorciatoia fondamentale per far progredire la prossima generazione di sistemi intelligenti.