De afgelopen jaren is er meer informatie verloren gegaan dan in de eeuwen ervoor. Dat heeft deels te maken met het feit dat alles wat op het web komt niet per se gearchiveerd wordt. De geschiedenisrecorder past daarom in het tijdperk waarin data steeds belangrijker worden. Taalwetenschapper Piek Vossen, hoogleraar computationele lexicologie, ontwikkelde de recorder.Vossen was gisteravond bij Casa Luna, het volledige gesprek kun je hier beluisteren.
Vossen is naast hoogleraar ook programmeur. In die hoedanigheid heb ik hem ook leren kennen, als CTO van taaltechnologisch bedrijf Irion. Hij heeft de recorder zelf gebouwd. De machine verwerkt teksten in vier talen (Nederlands, Engels, Spaans en Italiaans) en analyseert tot welk thema ze horen. Het verzamelt alle feiten uit alle media in een bepaalde periode, en toont de afhankelijkheden, de verschillen en de overeenkomsten. Zo wordt een compleet overzicht van een bepaald thema gecreƫerd. De geschiedenisrecorder fungeert als het ware als het geheugen van het semantische web, maar ook van alle offline media. (Extended Limits)
dinsdag 9 oktober 2012
De geschiedenisrecorder van Piek Vossen
Abonneren op:
Reacties posten (Atom)
Geen opmerkingen:
Een reactie posten