domenica 18 aprile 2010

Google Books: i disastri

Il caos lavorativo delle ultime settimane non aiuta la riflessione, ma ogni tanto consente a qualche idea di tornare fuori, a intervalli (distanti). Una di queste domande, non più oziosa delle altre, era: perché non uso spesso Google Books?

In fin dei conti, io sono un gran consumatore proprio del genere di materiali digitalizzati da Google Books. Testi non più coperti da diritto d'autore, vecchie riviste, classici della saggistica... Però apro Google Books con grande riluttanza. Una tesi recente, per cui ho fatto da correlatore, mi ha aiutato a chiarire i motivi di questa istintiva diffidenza: non uso Google Books perché i metadati sono un disastro. Che libro sto vedendo? In quale edizione?

Il collega Geoffrey Nunberg ha pubblicato l'anno scorso un ottimo articolo su questo punto: Google's Book Search: a disaster for scholars. Gli esempi sono divertentissimi; la frustrazione del lettore... meno. Del tutto condivisibile la speigazione di Nunberg:

It's clear that Google designed the system without giving much thought to the need for reliable metadata. In fact, Google's great achievement as a Web search engine was to demonstrate how easy it could be to locate useful information without attending to metadata or resorting to Yahoo-like schemes of classification. But books aren't simply vehicles for communicating information, and managing a vast library collection requires different skills, approaches, and data than those that enabled Google to dominate Web searching.

Insomma, una diversa cultura aziendale, che mostra tutti i propri limiti quando associata a un settore da cui tutti gli addetti ai lavori si aspettano standard di qualità indicibilmente diversi. In fin dei conti, da secoli le biblioteche fanno - spesso molto bene - proprio il lavoro su cui Google ha clamorosamente fallito: descrivere con precisione dati abbastanza oggettivi e dichiarati.

Diverse delle definizioni di Nunberg sono sia appropriate che divertenti: "the book search's metadata are a train wreck: a mishmash wrapped in a muddle wrapped in a mess"; o, per quanto riguarda il sistema di classificazione (commerciale!) adottato, il fatto che "In short, Google has taken a group of the world's great research collections and returned them in the form of a suburban-mall bookstore".

Bon, parlare dei disastri è divertente (per esempio, se si va a vedere quanti libri su Internet, secondo Google, sono stati pubblicati prima del 1950...). Bisogna però vedere anche il rovescio della medaglia, e cioè quanto, ciononostante, Google Books riesca lo stesso a essere utile. Materiale per un prossimo post...

Nessun commento:

Creative Commons License
Blog di Mirko Tavosanis by http://linguaggiodelweb.blogspot.com is licensed under a Creative Commons Attribuzione-Non opere derivate 2.5 Italia License.