Linguaggio e scrittura: Testi generati a Dresda

venerdì 27 settembre 2024

Testi generati a Dresda

Non sono riuscito a parlarne sul momento, ma il 2 e il 3 settembre sono stato a Dresda per il II convegno AI-rom: “Automated texts in the romance languages and beyond”. Il convegno, ottimamente organizzato da Anna-Maria De Cesare, Tom Weidensdorfer e Michela Gargiulo, è poi di particolare interesse per chi si occupa di lingua italiana: a differenza di quanto avvenuto nel convegno dell’anno scorso, quest’anno tutti gli interventi erano dedicati appunto alla lingua italiana!

L’evento, naturalmente, è stato di estremo interesse: praticamente da ogni presentazione sono venuti fuori spunti per me molto interessanti. Impossibile descriverli qui tutti in dettaglio, ma vale la pena notare come su molte cose stia cominciando a formarsi un consenso.

Per pure ragioni di tempo accennerò qui solo al mio intervento, intitolato Grammatica generata: accettabilità e inaccettabilità di costruzioni prodotte dai sistemi di generazione di testo. All’interno, sono partito da studi recenti che hanno notato alcune divergenze linguistiche tra il comportamento umano e quello degli LLM quando sintassi e semantica sono intrecciate in modo particolarmente stretto. Per la lingua inglese sono in effetti già stati esaminati diversi esempi di questo tipo; per l’italiano, sono state mostrate da Anna-Maria De Cesare divergenze nell’espressione della progressione tematica e nell’uso dei connettivi.

Lato mio, mi sono occupato soprattutto di coesione e di quelle che Serianni ha chiamato “reggenze plurime”. Queste ultime, in effetti, rappresentano un ambito in cui il comportamento degli LLM e quello degli esseri umani mostrano sia divergenze sia punti di contatto. Per esempio, le costruzioni in cui una completiva esplicita e una completiva implicita vengono collocate in dipendenza dallo stesso verbo e coordinate, sebbene evitate nello scritto formale, sono relativamente frequenti sia nei testi di chi apprende l’italiano scritto sia nelle produzioni testuali degli LLM. Qui mi si vede appunto all’opera in una delle foto ufficiali:

Per i dettagli, rimando alla versione definitiva del contributo, che potrebbe uscire all’inizio dell’anno prossimo. Molti testi collegati al convegno saranno infatti ospitati dalla rivista AI-linguistica, che è già senz’altro un importante punto di riferimento per chi si occupa di questi temi… soprattutto in rapporto alla lingua italiana.