L’aspetto veramente interessante di Siri consiste nell’avvicinare milioni di consumatori alle tecnologie legate alla voce. Nulla di nuovo in termini assoluti, ma mai come oggi il livello di comprensione del parlato si è avvicinato a quanto immaginato, sognato e ipotizzato per decenni e decenni. Senza essere un esperto in materia, ritengo siano necessari ancora un paio d’anni al massimo per raggiungere quel livello di precisione, affidabilità, duttilità e efficacia attesa e indispensabile per questo genere di tecnologia. Ciò significa che nei prossimi 24 mesi assisteremo alla continua introduzione di soluzioni capaci di interpretare correttamente il parlato (dapprima inglese americano) che sposteranno progressivamente la barra verso l’alto. D’altronde già da oltre un anno i dispositivi Android di fascia alta dispongono di Google Translate, un’applicazione capace di convertire stringhe di testo da una lingua in un’altra fornendo anche la pronuncia. Immagine soluzioni software integrate in dispositivi hardware come un telefono che consentono la traduzione simultanea di una conversazione che avviene tra due interlocutori in lingue differenti non è certo utopistico, né fantascientifico.
Con Siri non si tratta solo di riconoscimento vocale. C’è di più di quello. Mi riferisco all’intelligenza intrinseca del prodotto che arriva a interagire con il possessore di un iPhone 4s, quasi come se si realizzasse un dialogo uomo macchina. Dietro tutto ciò una notevole “intelligenza software” basata su knowledge base in costante evoluzione, una velocità computazionale sorprendente (non sul telefono però) e sofisticati algoritmi capaci di interpretare il senso delle interazioni vocali oltre che a trasformarle in stringhe di testo. Per Apple questo significa trattenere all’interno del proprio ecosistema software & hardware un’altra componente addizionale di valore visto che con Siri i comandi ricevuti non vengono semplicemente eseguiti, ma prima ancora interpretati e “ragionati”. La gran parte delle possibili interazioni con Siri che “escono” dalle competenze del telefono sono infatti ora arbitrate da Apple che si trova nella favorevole posizione di stabilire come e con chi trovare la migliore risposta possibile al quesito ricevuto. mentre in una richiesta tradizionale attraverso un motore di ricerca la scelta su chi avvalersi era intrinseca nelle impostazioni di sistema, oggi è Siri che dinamicamente decide come comportarsi. Quindi, giusto per fornire un esempio, alcune interrogazioni riconducibili ad aspetti legati alla conoscenza potrebbero essere rivolte ed eseguite direttamente in Wikipedia. Altre, in altri motori verticali iper-specializzati o in marketplace sufficientemente ampi da poterli ritenere dei veri e propri contenitori di informazioni di settore (penso ad Amazon.com per quanto riguarda giocattoli, prodotti di consumer electronics e altre merceologie). Insomma, molto di più di un semplice riconoscimento vocale, ma una super significativa sfida tecnologica capace di impattare e potenzialmente di cambiare gli scenari consolidati di questo primo decennio di Internet. Interessante, molto interessante. Ancora una volta – occorre sottolinearlo – il risultato di R&D.
Stefano Maruzzi
Techno Geek. Autore. Amante della corsa, del tennis e della fotografia digitale. Vice President EMEA in GoDaddy nel Regno Unito.
Seguimi su Linkedin »
Gli ultimi post
I vostri commenti
- Giuliana su Cosa significa essere un’azienda multinazionale
- valter latore su Chi sono
- Rose Martine su I quotidiani USA vanno letteralmente a ruba
- smaruzzi su Lower and Upper Antelope Canyons: vanno visitati
- emanuela su Lower and Upper Antelope Canyons: vanno visitati