Ricercatori di Google e di Stanford annunciano miglioramenti riguardo il riconoscimento automatico delle immagini

L’informazione trasmessa sotto forma di immagini è la forma più antica e semplice di comunicazione, pensiamo ad esempio ai pittogrammi preistorici. L’evoluzione di questo tipo di comunicazione si è accompagnato per tutta la storia dell’uomo fino a giungere ai giorni nostri dove ogni momento della nostra vita viene immortalato di continuo sotto forma di video e foto pubblicate in Rete.

Organizzare e ricercare quello che interessa nella Rete è sempre stata una sfida della scienza dell’informazione, una battaglia che negli ultimi anni sembra ormai vinta da Google. Anche per una persona non esperta può essere piuttosto semplice immaginare come possa essere rintracciata l’informazione in un testo, pensate ad esempio a come funziona un dizionario dove esiste un indice con un elenco di parole che riportano ad una determinata pagina. Ma come fare a rintracciare e catalogare le informazioni che sono contenute in delle foto? Dovrebbe esistere un programma, un sistema intelligente ed automatico in grado di capire cosa è contenuto nella foto!

Cacciate ora il condizionale perchè è notizia di poche ore fa che due distinti gruppi di ricerca uno che lavora presso Google e un altro gruppo di scienziati della Università di Standford hanno pubblicato il risultato riguardante algoritmi di intelligenza artificiale in grado di risolvere proprio questo problema. Le reti neurali che creano l’intelligenza artificiale riescono a scoprire somiglianze e modelli nei dati che altrimenti sarebbe difficile riscontrare e fatto ancora più importante sono in grado di apprende attraverso degli esempi. Ma cosa sono le reti neurali? Pensatele come  a dei sistemi di equazioni matematiche interconnesse secondo un principio inspirato ai processi del cervello umano.

In questo esempio è possibile vedere come la stessa immagine viene descritta in modo diverso da un essere umano e dal software

L’avanzamento in questo campo di ricerca è cruciale non solo per migliorare la quantità e la qualità dell’informazione che è possibile reperire in Rete ma sarà riutilizzabile in altri contesti. Un esempio pratico, potrebbe essere quello di realizzare delle macchine che interpretano il paesaggio intorno a loro mentre vengono guidate. Il futuro è già qui.

Bibliografia

http://cs.stanford.edu/people/karpathy/deepimagesent/

 

verascienza