dinsdag 9 oktober 2012

De geschiedenisrecorder van Piek Vossen


De afgelopen jaren is er meer informatie verloren gegaan dan in de eeuwen ervoor. Dat heeft deels te maken met het feit dat alles wat op het web komt niet per se gearchiveerd wordt. De geschiedenisrecorder past daarom in het tijdperk waarin data steeds belangrijker worden. Taalwetenschapper Piek Vossen, hoogleraar computationele lexicologie, ontwikkelde de recorder.

Vossen is naast hoogleraar ook programmeur. In die hoedanigheid heb ik hem ook leren kennen, als CTO van taaltechnologisch bedrijf Irion. Hij heeft de recorder zelf gebouwd. De machine verwerkt teksten in vier talen (Nederlands, Engels, Spaans en Italiaans) en analyseert tot welk thema ze horen. Het verzamelt alle feiten uit alle media in een bepaalde periode, en toont de afhankelijkheden, de verschillen en de overeenkomsten. Zo wordt een compleet overzicht van een bepaald thema gecreƫerd. De geschiedenisrecorder fungeert als het ware als het geheugen van het semantische web, maar ook van alle offline media. (Extended Limits)
Vossen was gisteravond bij Casa Luna, het volledige gesprek kun je hier beluisteren.

Geen opmerkingen:

Een reactie plaatsen