zaterdag 15 januari 2011

Cultuurgeschiedenis en taalontwikkeling in Google Books

Vandaag in de NRC een uitgebreid artikel over het doorzoeken van het corpus van Google Books. Eerder schreef Long Now ook al over de zogenaamde Ngram Viewer van Google.
Google’s new Ngram Viewer is a graphical interface for looking at the frequency of words over time in the several million books scanned into their database.
Bovenstaande grafiek is afkomstig uit Discover Magazine, waar een uitgebreide beschrijving van de achtergronden en de mogelijkheden van de Ngram Viewer te lezen is.
Jammer is dat het corpus van beschikbare teksten tot nu toe beperkt is tot Engels, Amerikaans, Frans, Duits, Hebreeuws, Chinees, Russisch en Spaans. Wat daarentegen wel weer mooi is, de data zijn voor iedereen vrij beschikbaar, waardoor iedereen zijn eigen experimenten kan uitvoeren.

Gerelateerd
Metadata, digitalisering en Google Books
Zoeken naar boeken met Google
Is Google goed voor geschiedenis?

Geen opmerkingen:

Een reactie plaatsen