donderdag 4 november 2010

Zoeken naar Boeken met Google

Bij het zoeken naar websites maakt Google gebruik van het grotendeels geheime algoritme PageRank. In de kern gaat dit uit van de relaties tussen webpagina's. Kort gezegd, als websites waar veel naar gelinkt wordt, naar een bepaalde pagina verwijzen, dan is die laatste pagina redelijk belangrijk. Als alleen pagina's waar amper naar verwezen wordt naar een pagina verwijzen, dan komt die laatste minder hoog in de zoekresultaten te staan. Maar er is meer en de finesses daarvan worden natuurlijk niet bekend gemaakt.
Bij boeken zou een dergelijk systeem van verwijzingen alleen werken als het om wetenschappelijke publicaties met voetnoten gaat. Je kunt dan meten wie hoe vaak naar welke publicatie verwijst en daarmee de waarde van een publicatie bepalen. Maar lang niet alle boeken in Google Books hebben voetnoten...
In The Atlantic wordt een tipje gelicht van de sluier die over zoeken naar boeken ligt.
Now, the book search algorithm takes into account more than 100 "signals," individual data categories that Google statistically integrates to rank your results. When you search for a book, Google Books doesn't just look at word frequency or how closely your query matches the title of a book. They now take into account web search frequency, recent book sales, the number of libraries that hold the title, and how often an older book has been reprinted.

So, if you search "Help" now, you get a big blow-up of Kathryn Stockett's 2009 book, not one of the dozens of other books with the same title. Or if you search "dragon tattoo," you get Stieg Larsson's blockbuster, not the 2008 children's book actually called Dragon Tattoo.
 Vooral dat laatste zinnetje vind ik apart...

Gerelateerd
Metadata, digitalisering en Google Books
Is Google goed voor Geschiedenis?

Plaatje: AlaskanLibrarian

Geen opmerkingen:

Een reactie plaatsen