NVIDIA lansează Nemotron 3 Super, un nou model de inteligență artificială pentru agenți autonomi
Gigantul tehnologic NVIDIA a prezentat recent modelul de inteligență artificială Nemotron 3 Super, o platformă concepută pentru a eficientiza dezvoltarea agenților AI autonomi. Acești agenți sunt creați pentru a executa sarcini complexe pe termen lung, inclusiv procesare de volume mari de date și menținerea contextului în fluxuri de lucru extinse. Noul model promite să abordeze două dintre cele mai mari provocări ale sistemelor agentice: costurile ridicate de procesare a datelor și dificultatea de a menține informațiile relevante pe parcursul operațiunilor complexe.
Modelul utilizează o arhitectură specială pentru a gestiona eficient sarcinile complexe. Nemotron 3 Super integrează 120 de miliarde de parametri, dar activează simultan doar o parte din aceștia, aproximativ 12 miliarde, în timpul inferenței. Această abordare ajută la reducerea costurilor de calcul și la accelerarea timpilor de răspuns, fără a compromite performanța. Modelul folosește o arhitectură de tip Mixture-of-Experts (MoE), selectând dinamic componente specializate pentru diferite tipuri de sarcini. Prin comprimarea datelor înainte de a le direcționa către experți, sistemul poate folosi mai multe module specializate fără a crește costurile.
Memorie extinsă și optimizări pentru performanță
Una dintre caracteristicile cheie ale Nemotron 3 Super este fereastra de context extinsă, care poate cuprinde până la un milion de unități de informație (tokeni). Aceasta permite agenților AI să rețină informații importante pe durata proceselor complexe și de lungă durată, reducând riscul de a pierde obiectivele inițiale. În plus, modelul folosește tehnici precum generarea simultană a mai multor unități logice și decodificarea speculativă pentru a accelera producerea de răspunsuri, mai ales în cazul secvențelor lungi de date.
Modelul este optimizat pentru infrastructura de ultimă generație. Nemotron 3 Super folosește o arhitectură hibridă Mamba-Transformer, concepută pentru a optimiza utilizarea memoriei și a resurselor de calcul. Modelul a fost antrenat pe infrastructura bazată pe arhitectura Blackwell, și se estimează că poate rula de până la patru ori mai rapid pe acceleratoarele NVIDIA B200 comparativ cu generațiile anterioare. Optimizarea modelului a inclus tehnici de învățare prin recompensă aplicate în mediul de testare NeMo Gym, cu peste 1,2 milioane de simulări dedicate fluxurilor de lucru ale agenților AI.
Aplicații practice și rezultate promițătoare
Noul model este destinat unei game largi de scenarii profesionale, inclusiv dezvoltarea software, analiza incidentelor de securitate cibernetică, cercetarea în științele vieții și administrarea sistemelor IT la nivel de companie. Potrivit NVIDIA, modelul a obținut rezultate de top în testele PinchBench, o măsurătoare care evaluează performanța modelelor lingvistice utilizate ca nucleu de raționament pentru agenții AI. Lansarea Nemotron 3 Super reprezintă un pas important către adoptarea la scară largă a agenților AI, oferind o soluție mai eficientă și flexibilă pentru automatizarea sarcinilor complexe.
