NVIDIA ha annunciato il lancio di Cosmos 3, un modello di fondazione aperto dedicato all’intelligenza artificiale fisica. La presentazione è avvenuta durante l’evento GTC di Taipei, dove l’azienda ha illustrato le caratteristiche tecniche del nuovo sistema.
Secondo quanto riportato dalla società, Cosmos 3 si basa su un’architettura definita “mixture-of-transformers”. Questo sistema integra in un unico modello diverse capacità, tra cui il ragionamento visivo, la generazione di mondi e la previsione delle azioni.
Il modello viene presentato come un “omnimodello” aperto, capace di comprendere e generare in modo nativo contenuti testuali, immagini, video e suoni ambientali, oltre a gestire azioni con un’elevata accuratezza fisica.
NVIDIA indica che l’implementazione di questa tecnologia permetterebbe di ridurre i tempi di addestramento e valutazione per l’IA fisica, portandoli da una scala di mesi a quella di pochi giorni.
Le informazioni sono state rilasciate attraverso i canali ufficiali dell’azienda e non sono attualmente disponibili verifiche indipendenti o analisi di terze parti in merito alle prestazioni dichiarate del modello.
