Visualizzazione post con etichetta Google Books. Mostra tutti i post
Visualizzazione post con etichetta Google Books. Mostra tutti i post

lunedì 3 maggio 2010

Cercare il bisnonno con Google Books

Tornando al discorso di Google Books: qualche mese fa ho fatto un po' di prove per vedere come funziona il meccanismo. Io ho la fortuna di avere un cognome che in pratica rappresenta una chiave univoca di ricerca: la sequenza di caratteri "tavosanis" non è mai stata usata, apparentemente, in alcuna lingua del mondo o in alcun sistema di scrittura, se non per indicare i miei parenti lato paterno... Quindi, una ricerca genealogica mi è sembrata un buon modo per partire.

Un vantaggio ulteriore è dato dal fatto che dal lato paterno le cognizioni sulla storia della mia famiglia si fermano incredibilmente presto. A domanda su chi fosse suo nonno, mio padre ha risposto: "Credo [sic!] che si chiamasse Osvaldo". Nient'altro. Quindi, c'era un buon margine di miglioramento. Qualche mese fa ho fatto quindi una ricerca, e ho scoperto un po' di cose interessanti. Altre le ho scoperte ripetendo la ricerca in questi giorni.

Partiamo dall'attualità. Inserire oggi "Osvaldo Tavosanis" (senza virgolette) su Google porta un sacco di link, ma sono tutti non pertinenti (due di questi riguardano un "Osvaldo Tavosanis" contemporaneo). Se però si fa la ricerca su Google Books le cose cambiano: il primo risultato è un libro di Luigi Huetter, Iscrizioni della città di Roma dal 1871 al 1920, pubblicato nel 1962 (Google Books presenta poi il libro in tre diverse versioni, nel solito modo confuso, ma il testo sembra sempre il solito). Insomma, non tutto ciò che è in Google Books salta fuori con la normale ricerca di Google.

Poi, arriva la frustrazione. Il nome viene visualizzato, ma solo come frammento di un elenco che secondo Google proviene dalla p. 263 del libro:







Di quale elenco si tratta? Non si sa, perché Google Books non permette di vedere altro. Cautele fatte per il diritto d'autore, d'accordo; ma qui la citazione senza indicazione della lista non è molto interessante. Se si cerca "Tavosanis" all'interno del libro, inoltre, al posto del brano appena indicato compare un rinvio all'indice dei nomi (pagina 575). Però la visualizzazione in questo caso mostra un frammento non pertinente, visto che è stato tagliato qualche millimetro sopra il punto giusto:







Soprattutto, qualche mese fa avevo fatto la stessa ricerca e accanto al libro di Huetter era saltato fuori un risultato che spiegava tutto, proveniente dall'Albo d'oro dei caduti della I Guerra Mondiale:

42 TAVOSANIS Osvaldo fu Leonardo 21-05-1881 soldato 2° Reggimento Fanteria 03/09/1917

Qui sì che c'era un condensato di informazioni: il nome del trisnonno, le date di nascita e di morte del bisnonno e, implicitamente, il motivo della sua prematura scomparsa (il 3 settembre del 1917 era in pieno svolgimento, tra l'altro, la battaglia di Monte San Gabriele, appena dopo la conclusione dell'undicesima battaglia dell'Isonzo). Però adesso questo testo, attraverso Google, non sembra più rintracciabile in nessun modo... Un po' frustrante, in effetti!

Riassumendo: Google Books (o "Google libri", come dice la versione italiana del sito) è uno strumento incredibilmente potente e utile. Se non ci fosse stato, ancora oggi in famiglia nessuno saprebbe nulla del bisnonno, a parte il vago ricordo del nome... Ma, proprio perché lo strumento ha possibilità incredibili, i problemi della presentazione finale sembrano ancora più fastidiosi.

domenica 18 aprile 2010

Google Books: i disastri

Il caos lavorativo delle ultime settimane non aiuta la riflessione, ma ogni tanto consente a qualche idea di tornare fuori, a intervalli (distanti). Una di queste domande, non più oziosa delle altre, era: perché non uso spesso Google Books?

In fin dei conti, io sono un gran consumatore proprio del genere di materiali digitalizzati da Google Books. Testi non più coperti da diritto d'autore, vecchie riviste, classici della saggistica... Però apro Google Books con grande riluttanza. Una tesi recente, per cui ho fatto da correlatore, mi ha aiutato a chiarire i motivi di questa istintiva diffidenza: non uso Google Books perché i metadati sono un disastro. Che libro sto vedendo? In quale edizione?

Il collega Geoffrey Nunberg ha pubblicato l'anno scorso un ottimo articolo su questo punto: Google's Book Search: a disaster for scholars. Gli esempi sono divertentissimi; la frustrazione del lettore... meno. Del tutto condivisibile la speigazione di Nunberg:

It's clear that Google designed the system without giving much thought to the need for reliable metadata. In fact, Google's great achievement as a Web search engine was to demonstrate how easy it could be to locate useful information without attending to metadata or resorting to Yahoo-like schemes of classification. But books aren't simply vehicles for communicating information, and managing a vast library collection requires different skills, approaches, and data than those that enabled Google to dominate Web searching.

Insomma, una diversa cultura aziendale, che mostra tutti i propri limiti quando associata a un settore da cui tutti gli addetti ai lavori si aspettano standard di qualità indicibilmente diversi. In fin dei conti, da secoli le biblioteche fanno - spesso molto bene - proprio il lavoro su cui Google ha clamorosamente fallito: descrivere con precisione dati abbastanza oggettivi e dichiarati.

Diverse delle definizioni di Nunberg sono sia appropriate che divertenti: "the book search's metadata are a train wreck: a mishmash wrapped in a muddle wrapped in a mess"; o, per quanto riguarda il sistema di classificazione (commerciale!) adottato, il fatto che "In short, Google has taken a group of the world's great research collections and returned them in the form of a suburban-mall bookstore".

Bon, parlare dei disastri è divertente (per esempio, se si va a vedere quanti libri su Internet, secondo Google, sono stati pubblicati prima del 1950...). Bisogna però vedere anche il rovescio della medaglia, e cioè quanto, ciononostante, Google Books riesca lo stesso a essere utile. Materiale per un prossimo post...

martedì 3 febbraio 2009

Darnton e Google


Prima dell'inizio dei corsi, tra una tesi e l'altra, ho un po' di tempo per fare le letture e schedature necessarie per le mie ricerche sul linguaggio del web. In questo periodo sto quindi accumulando un bel po' di letture ad hoc... e anche qualcosa sui margini.

Per esempio, ho scoperto che di recente la New York Review of Books ha pubblicato un bell'articolo di Robert Darnton su Google & the future of books. Per gli addetti ai lavori Darnton è un nome che non ha bisogno di presentazioni: ha studiato il commercio librario nell'età dell'Illuminismo, mostrando tra le altre cose come l'Encyclopèdie di Diderot fosse anche un grosso affare dal punto di vista economico. Anche in questo articolo compaiono del resto evocazioni da applausi a scena aperta:

"The eighteenth century imagined the Republic of Letters as a realm with no police, no boundaries, and no inequalities other than those determined by talent. Anyone could join it by exercising the two main attributes of citizenship, writing and reading. Writers formulated ideas, and readers judged them. Thanks to the power of the printed word, the judgments spread in widening circles, and the strongest arguments won."
Però, soprattutto, l'articolo è un intelligente bilancio delle possibilità e dei rischi collegati al recente accordo tra Google Books e un gruppo di autori e detentori di diritti. L'accordo è complesso, ma nella ricostruzione di Darnton

"... the class action character of the settlement makes Google invulnerable to competition. Most book authors and publishers who own US copyrights are automatically covered by the settlement. They can opt out of it; but whatever they do, no new digitizing enterprise can get off the ground without winning their assent one by one, a practical impossibility, or without becoming mired down in another class action suit. If approved by the court—a process that could take as much as two years—the settlement will give Google control over the digitizing of virtually all books covered by copyright in the United States."

Dietro ci sono possibilità e rischi. Penso che chiunque abbia usato Google Books si sia trovato di fronte a entrambi... da un lato la soddisfazione di scoprire che quello che ti interessa è all'interno di un libro specifico, e che senza Google non l'avresti mai trovato. Dall'altro la frustrazione di scoprire che non puoi accedere al contenuto, non perché ci siano problemi tecnici ma a causa della protezione dei diritti; e che la copia "legittima" più vicina è inaccessibile.
Creative Commons License
Blog di Mirko Tavosanis by http://linguaggiodelweb.blogspot.com is licensed under a Creative Commons Attribuzione-Non opere derivate 2.5 Italia License.