Riconoscimento immagini: quel software troppo umano

di Mikael Thalen

I programmi di Google e della Stanford University che traducono immagini complesse in testo scritto sollevano grandi preoccupazioni sulla censura. Scienziati dell’Università di Stanford e di Google hanno sviluppato due nuovi software di inteligenza artificiale in grado di descrivere immagini con un livello di accuratezza quasi umano.

Una pubblicazione scientifica della Stanford, intitolata “Profondi allineamenti semantico-visivi per generare descrizioni di immagini” spiega come specifici dettagli di foto e video possano essere tradotti in testo scritto. “Presentiamo un modello che genera descrizioni di immagini in un linguaggio naturale”, afferma l’introduzione della pubblicazione. “Il nostro modello utilizza una banca dati di immagini e delle frasi che le descrivono per apprendere le corrispondenze intermodali tra testo e dati visivi.” Comparando le descrizioni fornite dal software con quelle fatte da umani, i ricercatori hanno scoperto che spesso fornivano lo stesso livello di comprensione dell’immagine.
La versione di Google di questa tecnologia, presentata nella pubblicazione.“Mostra e dici: un generatore neurale di descrizioni di immagini”, è stata capace di produrre risultati comparabili. Nonostante il programma faticasse quando gli venivano sottoposti set di immagini completamente nuove, gli scienziati di Google hanno notato l’abilità del software di “imparare” da ogni nuova interazione.
“Sono rimasto affascinato dal fatto che anche con i pochi dati di addestramento forniti siamo stati in grado di fare così bene”, ha dichiarato al New York Times, Oriol Vinyalis, scienziato di Google.  Miliardi di video ed immagini postati online saranno plausibilmente analizzati e categorizzati da Google quando questa tecnologia sarà perfezionata, consentendo la catalogazione in tempo reale dei contenuti multimediali mentre vengono caricati su internet.“Il settore sta partendo ora, e vedremo notevoli incrementi” ha aggiunto Vinyalis.   Anche se gli scienziati di Google hanno evidenziato possibili usi per i non vedenti, i profondi legami dell’azienda con le agenzie di sicurezza USA detteranno probabilmente l’utilizzo finale dell’applicazione.  Mentre Google diventa velocemente uno dei più importanti gruppi lobbistici di Washington D.C., c’è chi evidenzia il potenziale della tecnologia nel censurare dati prima che questi possano essere caricati sul web.  La storia di Google come censore di contenuti politici è da tempo documentata, con ben noti video come il filmato di Wikileaks riguardante attacchi di elicotteri USA, rimosso dal canale YouTube del giornalista Alex Jones nel 2010.  In effetti, Google ha ottemperato a migliaia di richieste provenienti da governi di tutto il mondo censurando e rimuovendo contenuti nonostante non ci fossero in molti casi chiare violazioni di leggi. L’ex CEO di Google, Eric Schmidt, consulente elettorale e tra i principali finanziatori di Barack Obama, ha anch’egli pubblicamente manifestato il suo sprezzo per la privacy umana.  “Non abbiamo neppure bisogno che voi digitiate. Sappiamo dove siete. Sappiamo dove siete stati. Possiamo bene o male sapere a cosa state pensando”, ha dichiarato Schmidt nel 2010. “Sappiamo tutto quello che state facendo ed il governo vi può tracciare. Conosciamo per filo e per segno i vostri spostamenti”.  Sia che stia spingendo i suoi clienti a mettere microfoni nei soffitti, partecipando al programma PRISM, sia che stia scansionando ogni account privato di Gmail, il gigante Hi-tech senza dubbio continuerà ad esercitare il suo potere sostenuto dal governo nei confronti di milioni di utenti del web in tutto il mondo.

Traduzione per Megachip a cura di Il Petruss.

Scrivi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.