
Una rete neurale "liquida" modellata sul cervello di minuscole creature è stata svelata dai ricercatori del MIT l'anno scorso. Per attività pratiche e critiche per la sicurezza come guidare e volare, stiamo parlando di una classe di modelli di machine learning robusti e adattivi che possono apprendere sul posto di lavoro e adattarsi alle mutevoli condizioni. L'adattabilità di queste reti neurali "liquide" rafforza la comunicazione del nostro mondo interconnesso, il che significa un migliore processo decisionale per una varietà di attività ad alta intensità di dati di serie temporali come il monitoraggio del cuore e del cervello, le previsioni meteorologiche e i prezzi delle azioni.
Tuttavia, poiché il numero di neuroni e sinapsi in questi modelli aumenta, diventano computazionalmente costosi e richiedono programmi per computer ingombranti per risolvere la complessa matematica alla base. E proprio come con molti fenomeni fisici, risolvere tutta questa aritmetica diventa più difficile con le dimensioni, che richiedono il calcolo di molti piccoli passi per arrivare a una soluzione.
Lo stesso team di scienziati ha trovato un modo per ridurre questo collo di bottiglia risolvendo l'equazione differenziale alla base della connessione di due neuroni tramite sinapsi per rivelare una nuova classe di sistemi di intelligenza artificiale veloci ed efficienti. Sebbene queste modalità siano molto più veloci e scalabili delle reti neurali liquide, condividono le stesse caratteristiche flessibili, causali, robuste e spiegabili.
Di conseguenza, poiché sono piccole e flessibili anche dopo l'addestramento, a differenza di molti modelli tradizionali fissi, questo tipo di rete neurale può essere utilizzato per qualsiasi attività che implichi l'acquisizione di informazioni dettagliate sui dati nel tempo.
I modelli di rete neurale "Closed Form Continuous Time" (CfC) hanno superato le loro controparti all'avanguardia in una varietà di attività, tra cui l'elaborazione di immagini sequenziali basate su eventi, la modellazione della dinamica fisica di un robot che cammina simulato e il riconoscimento dell'attività umana da sensori di movimento. Ad esempio, i nuovi modelli sono stati 8.000 volte più veloci su un campione di 220 pazienti per un'attività di previsione medica.
Secondo la professoressa del MIT Daniela Rus, direttrice del Computer Science and Artificial Intelligence Laboratory (CSAIL) e autrice senior del nuovo documento, "I nuovi modelli di apprendimento automatico, che chiamiamo 'CfC', sono focalizzati sull'integrazione numerica, sostituendo l'equazione differenziale che descrive il calcolo del neurone con un approccio in forma chiusa. conserva le belle proprietà delle maglie liquide senza la necessità di “I modelli CfC sono efficienti, causali, condensati e spiegabili da addestrare e prevedere. Aprono la porta a un apprendimento automatico affidabile per le applicazioni essenziali per la sicurezza".
Possiamo calcolare lo stato mutevole del mondo o un fenomeno nel tempo utilizzando equazioni differenziali, ma possiamo farlo solo passo dopo passo nel tempo. Il team ha rovistato tra le loro borse di trucchi matematici per trovare la soluzione perfetta.
Una soluzione "in forma chiusa" che modella l'intera descrizione di un intero sistema in un unico passaggio computazionale per modellare i fenomeni naturali nel tempo e comprendere il comportamento passato e presente, come il riconoscimento delle attività umane o il percorso seguito da un robot.
Il loro modello consente di calcolare questa equazione in qualsiasi momento nel passato o nel futuro. Non solo, il calcolo è molto più veloce poiché l'equazione differenziale non deve essere risolta passo dopo passo.
Immagina una rete neurale end-to-end che utilizza una telecamera integrata in un'auto per fornire input di guida. La rete è addestrata per produrre output come l'angolo di sterzata dell'auto. Nel 2020, il team è riuscito a creare un'auto che potrebbe essere guidata da 19 neuroni e un piccolo modulo di rilevamento utilizzando reti neurali fluide a 19 nodi. Ogni nodo del sistema è descritto da un'equazione differenziale. Poiché la soluzione in forma chiusa è una buona approssimazione della dinamica effettiva del sistema, modificandola in questa mesh si otterrà esattamente il comportamento che si sta cercando. Di conseguenza, possono risolvere il problema con ancora meno neuroni, rendendo il processo più veloce e meno costoso dal punto di vista computazionale.
Fonte e ulteriori letture: techxplore.com/news/2022-11-brain-dynamics-flexible-machine-learning.html
Günceleme: 21/11/2022 14:03
Sii il primo a commentare