[youtube=http://www.youtube.com/watch?v=E91Qu1nVQtE]Non male questo video sul funzionamento di Siri nelle mani di un australiano con tutte le implicazioni del caso dovute all’acento particolare. Emerge come il prodotto non sia in grado di fornire informazioni su business listings all’esterno degli USA, almeno al momento. Oltre a ciò, Siri sembra cavarsela bene comunque in alcuni passaggi non proprio semplici anche per sostanza oltre che per pronuncia. Personalmente sono positivamente sorpreso da quanto Siri sembrerebbe essere in grado di fare grazie anche a un ampio database di risposte smart a domande non propriamente legate all’uso del dispositivo in quanto tale.
L’aspetto veramente interessante di Siri consiste nell’avvicinare milioni di consumatori alle tecnologie legate alla voce. Nulla di nuovo in termini assoluti, ma mai come oggi il livello di comprensione del parlato si è avvicinato a quanto immaginato, sognato e ipotizzato per decenni e decenni. Senza essere un esperto in materia, ritengo siano necessari ancora un paio d’anni al massimo per raggiungere quel livello di precisione, affidabilità, duttilità e efficacia attesa e indispensabile per questo genere di tecnologia. Ciò significa che nei prossimi 24 mesi assisteremo alla continua introduzione di soluzioni capaci di interpretare correttamente il parlato (dapprima inglese americano) che sposteranno progressivamente la barra verso l’alto. D’altronde già da oltre un anno i dispositivi Android di fascia alta dispongono di Google Translate, un’applicazione capace di convertire stringhe di testo da una lingua in un’altra fornendo anche la pronuncia. Immagine soluzioni software integrate in dispositivi hardware come un telefono che consentono la traduzione simultanea di una conversazione che avviene tra due interlocutori in lingue differenti non è certo utopistico, né fantascientifico.
Con Siri non si tratta solo di riconoscimento vocale. C’è di più di quello. Mi riferisco all’intelligenza intrinseca del prodotto che arriva a interagire con il possessore di un iPhone 4s, quasi come se si realizzasse un dialogo uomo macchina. Dietro tutto ciò una notevole “intelligenza software” basata su knowledge base in costante evoluzione, una velocità computazionale sorprendente (non sul telefono però) e sofisticati algoritmi capaci di interpretare il senso delle interazioni vocali oltre che a trasformarle in stringhe di testo. Per Apple questo significa trattenere all’interno del proprio ecosistema software & hardware un’altra componente addizionale di valore visto che con Siri i comandi ricevuti non vengono semplicemente eseguiti, ma prima ancora interpretati e “ragionati”. La gran parte delle possibili interazioni con Siri che “escono” dalle competenze del telefono sono infatti ora arbitrate da Apple che si trova nella favorevole posizione di stabilire come e con chi trovare la migliore risposta possibile al quesito ricevuto. mentre in una richiesta tradizionale attraverso un motore di ricerca la scelta su chi avvalersi era intrinseca nelle impostazioni di sistema, oggi è Siri che dinamicamente decide come comportarsi. Quindi, giusto per fornire un esempio, alcune interrogazioni riconducibili ad aspetti legati alla conoscenza potrebbero essere rivolte ed eseguite direttamente in Wikipedia. Altre, in altri motori verticali iper-specializzati o in marketplace sufficientemente ampi da poterli ritenere dei veri e propri contenitori di informazioni di settore (penso ad Amazon.com per quanto riguarda giocattoli, prodotti di consumer electronics e altre merceologie). Insomma, molto di più di un semplice riconoscimento vocale, ma una super significativa sfida tecnologica capace di impattare e potenzialmente di cambiare gli scenari consolidati di questo primo decennio di Internet. Interessante, molto interessante. Ancora una volta – occorre sottolinearlo – il risultato di R&D.