martedì 19 ottobre 2021

Pieraccini, AI Assistants


 
Copertina di Roberto Pieraccini, AI Assistants
A parer mio, i moderni assistenti digitali sono prodotti di estremo interesse per la linguistica e potrebbero avere sviluppi rivoluzionari in particolare nell’insegnamento delle lingue. Quasi quattro anni fa (!) ne avevo parlato nel mio Lingue e intelligenza artificiale, ma negli anni seguenti lo sviluppo è stato notevolissimo. Tanto per dirne una, quando il mio libro è uscito non erano ancora arrivati in Italia gli altoparlanti intelligenti, come i sistemi Alexa di Amazon e Google Home, e i sistemi di dialogo in commercio avevano appena iniziato a mantenere il contesto della conversazione…
 
Eppure, nonostante gli sviluppi e le promesse, le pubblicazioni in proposito sono state ben poche. Solo negli ultimi mesi sono finalmente comparsi alcuni libri che descrivono in modo sistematico i moderni assistenti digitali, che fino a oggi erano descritti in sostanza solo dalle pubblicazioni specialistiche (con molte informazioni rimaste implicite nelle conoscenze dei ricercatori) o da istruzioni per l’uso come quelle di Dialogflow.
 
Del secondo di questi libri, Hey, Cyba!, conto di parlare più avanti. Qui invece vorrei parlare di AI Assistants, che, firmato da Roberto Pieraccini per la collana Essential Knowledge del MIT, finalmente descrive in modo sistematico il funzionamento degli assistenti digitali moderni.
 
Da un certo punto di vista il libro può essere considerato un’appendice o una continuazione dell’ottimo The Voice in the Machine dello stesso autore. Buona parte dello spazio, in effetti, è dedicata, più che agli assistenti digitali in sé, ai loro prerequisiti, cioè allo sviluppo delle tecnologie vocali dal dopoguerra a oggi. Questa storia era già stata raccontata in dettaglio appunto da The Voice in the Machine, ma la sovrapposizione tra i due libri è più ridotta di quanto si potrebbe immaginare: l’autore ha trattato il tema in modo nuovo. E soprattutto, queste informazioni sono importanti per comprendere molti aspetti del funzionamento degli assistenti digitali.
 
Una simile scelta fa sì che le caratteristiche specifiche degli assistenti digitali in quanto tali siano presentate solo nei due ultimi capitoli: il sesto, dedicato a The Dialog Manager, e il settimo, Interacting with an Assistant. Chi si sente già preparato sui modelli di Markov nascosti o sulle difficoltà connesse alla generazione del parlato potrebbe quindi essere tentato di saltare direttamente a questi… ma credo che sarebbe un peccato, perché la descrizione delle fasi precedenti è comunque interessante in questa nuova prospettiva.
 
Inoltre, molte delle informazioni presentate sono sì diffuse nell’ambiente, ma poco formalizzate e descritte. Questo fa sì che il testo fornisca informazioni difficilissime da ricostruire per gli esterni, come questa descrizione dello stato dell’arte per la gestione di pronomi e frasi incomplete:
 
Modern assistants are able to manage referential pronouns and incomplete sentences (called elliptical sentences) based on algorithms that unravel the structure of each query, determine whether the query is incomplete and missing elements such as the specific subject or intent, and try to answer it by resolving the missing elements with the right information. Those algorithms are based on a mix of language rules and the results of data analysis on large corpora of queries done in the past and aggregated over all the users (p. 169).
 
In questo punto, e in molti altri, non ci sono rinvii a fonti di informazione specifiche, e la cosa non mi sorprende. Dove si dovrebbero trovare, del resto?
 
In quanto alle modalità di esposizione, sono fondamentalmente non tecniche (e corrette e approfondite per quanto riguarda le componenti linguistiche). Tuttavia, come già succedeva in The Voice in the Machine, in alcuni punti sono molto sintetiche: nelle parti più tecniche è difficile che il lettore non informato possa comprendere tutto ciò che viene detto.
 
L’esposizione arriva però anche al personale nell’ultimo capitolo. Pieraccini, viareggino, laureato in Ingegneria a Pisa, ha lavorato a Torino al CSELT per poi spostarsi oltreoceano ai mitici Bell Labs e da lì a molte delle principali aziende del settore, avendo occasione di contribuire in prima persona a molti degli sviluppi descritti qui (adesso è Director of Engineering per Google Assistant a Zurigo). Uno di questi contributi ha riguardato lo sviluppo del “robot sociale” Jibo, che ha avuto una storia complessa e ha lasciato un segno importante, apparentemente, sia nella comunità degli sviluppatori sia tra gli utenti. Le pagine dedicate a questo argomento, oltre a essere tra le più interessanti nella mia prospettiva, mostrano un coinvolgimento non superficiale.
 
In definitiva: il libro è caldamente raccomandato a chiunque sia interessato a questi argomenti.
 
Roberto Pieraccini, AI Assistants, Cambridge (Massachusetts), MIT Press, 2021, pp. 288 (edizione tascabile), ISBN (edizione tascabile) 978-0-26254255-5, letto nell’edizione Kindle, ASIN B08PY9X5YF, € 10,99.
 

Nessun commento:

Creative Commons License
Blog di Mirko Tavosanis by http://linguaggiodelweb.blogspot.com is licensed under a Creative Commons Attribuzione-Non opere derivate 2.5 Italia License.