vrijdag 13 april 2012

Ik lees, ik lees wat jij niet leest (2)

Gisteren beschreef ik dat analoge teksten over het algemeen stabiel zijn: ze beginnen linksboven en eindigen na een lineair proces rechtsonder. David Smits zegt daarover:
‘Een auteur van een boek weet precies wat een lezer gelezen heeft wanneer hij bij een bepaalde pagina is [...]
Bij een website is dat anders. Het is moeilijk om te zien waar de lezer vandaan komt en welke pagina de gebruiker vooraf heeft bekeken. En dat is wel relevant voor dat wat je als auteur op de volgende pagina wil schrijven. Mijn systeem maakt dat op een generieke manier mogelijk voor een auteur. Hij ontwerpt niet alleen de inhoud van zijn pagina's, maar ontwerpt ook een domeinmodel. Daarbij koppelt hij de onderwerpen en de relaties tussen de onderwerpen.'
De uiterste consequentie heeft Smits bij zijn proefschrift toegepast: de tekst bestaat alleen online en is niet alleen een beschrijving van de door hem uitgedachte techniek, maar tegelijk ook de demonstratie ervan.
‘Ik vraag de lezer van mijn proefschrift bijvoorbeeld eerst naar zijn belangstelling. Ben je als leek geïnteresseerd in het onderwerp of zit je als expert in het vakgebied? In dat laatste geval hoef ik je niet lastig te vallen met allerlei hints of verhinderen dat je gedetailleerde stukken moeilijk kunt bekijken. Elke muisklik bevestigt dat de lezer iets heeft gelezen en belangstelling heeft in een nieuw onderwerp. Zo leert het systeem van de gebruiker, past het zich aan en gaat andere pagina's aanbevelen. In principe zou een lezer er niets van moeten merken. In de ideale omstandigheid zul je als gebruiker alleen die dingen lezen waar je naar op zoek was en die je kunt begrijpen.'
Dit had niet alleen tot gevolg dat de promotiecommissie niet met papier, maar met tablets aan tafel zal, maar ook - en daar gaat het mij om - dat ieder lid van de commissie een eigen versie van het proefschrift heeft gelezen! Het proefschrift bestaat niet.
(Op dit moment is dat letterlijk zo. Het proefschrift zou hier moeten staan, maar ik krijg al twee dagen een "Bad Gateway" na de redirect. Jammer, jammer, jammer...)

Ik heb de indruk dat die adaptieve webserver nogal wat gevolgen kan hebben voor de archivering van documenten.

In de voorbeelden van gisteren liet ik al zien dat er al jaren op papier en digitaal minder stabiele teksten zijn. Maar die zijn in wezen maar "spielerei". De ga-je-naar-links-of-ga-je-vechten-boekjes zijn dat letterlijk en de andere voorbeelden zijn 'maar' literatuur. Hierbij was het doel van in ieder geval Walter van den Broeck juist om te laten zien dat de wereld niet zo eenduidig en stabiel is, als wij vaak denken.
Maar bij archieven komen we op een ander vlak. Archieven documenteren gebeurtenissen en zijn "bewijs" van die gebeurtenissen. Dit betekent niet dat archiefstukken "waar" of "neutraal" zijn, maar wel dat het op basis van de archiefstukken mogelijk is om een gebeurtenis te reconstrueren. Vaak gaat het hierbij om de vraag: Wie wist wat op welk moment?
Het antwoord op die vraag hangt af van metadata, zoals onder andere bleek uit de discussie over metadata in de Tweede Kamer en Oswald and the CIA. Natuurlijk, een paraaf of een stempel op een papieren document betekent niet onomstotelijk dat iemand iets ook echt gelezen heeft, of zoals De Grave het zij: De minister is wel geïnformeerd, maar hij was niet op de hoogte.
En nu komt daar dus nog een element bij. Want de minister kan geïnformeerd zijn, hij kan het stuk zelfs gelezen hebben en toch niet op de hoogte zijn.
De slimme software van Smits ging er misschien wel van uit dat de minister allerlei zaken al wist en hij dus allerlei informatie over kon slaan. (Of, maar dat is gemeen, misschien vond de software dat sommige passages voor de minister te ingewikkeld waren en kreeg hij ze daarom niet gepresenteerd.)
In principe zou een lezer er niets van moeten merken, nee, maar je zou het wel moeten kunnen weten.

Wat kan dit betekenen voor archieven?
Volgen mij past hier het citaat van Bearman van gisteren op:
If we wished to preserve the game as an archive, the record of my actual ‘moves’ and their consequences would need to be preserved in a way that was directly tied to the actual game I played; these would be represented independently of the technology in which I played the game.
Op de een of andere manier zal dus het pad dat door het document gevolgd is, duurzaam vastgelegd en raadpleegbaar moeten zijn.
Zou Smits daaraan gedacht hebben? Ik denk dat ik hem maar eens een e-mail stuur met deze vragen.

Wat kan het nog betekenen voor archieven?
Een heel ander aspect van deze adaptieve systemen waar archieven hun voordeel mee zouden kunnen doen, is ze gebruiken bij het maken van (digitale) archieftoegangen. De TU/e gebruikt het systeem van Smits al als GALE (Generic Adaptive Learning Environment):
Gebruikers van GALE beseffen nog nauwelijks dat ze aan de hand worden genomen op basis van hun eigen gedrag. Want GALE onthoudt alle gegevens van een lezer. Iedere muisklik van de gebruiker en elke pagina die hij bezoekt worden in het geheugen van een webserver opgeslagen. Op basis van dat 'verleden' komt telkens nieuwe informatie beschikbaar. Meestal in de vorm van aanbevelingen via gekleurde verwijzingen. Maar het kan ook voorkomen dat de webserver stukken informatie (nog) niet toegankelijk maakt omdat de gebruiker wordt geacht zich eerst te verdiepen in andere materie.
Misschien kun je als archiefdienst op deze manier de bezoekers van de digitale studiezaal allemaal individueel bij de hand nemen en helpen of sturen waar dit nodig is. Interessant materie om nog eens wat langer over na te denken.
Misschien moeten we Smits gewoon eens uitnodigen voor een korte speel-en-deelsessie...

Gerelateerd
De dag dat de Kamer over metadata debatteerde
Gelezen: John Newman - Oswald and the CIA
Ik lees, ik lees wat jij niet leest (1)

T-shirt: Heren T-shirt SSSST Ik lees

7 opmerkingen:

  1. Zoals ik net op BREED schreef : "Mooi stuk Ingmar ! [...] Ik vind het een goed idee om Smits vragen te stellen en / of te
    vragen of hij een logfile (leespad) vast legt / kan leggen om redenen
    van de archivering / verantwoording. Zo weet je jaren later nog welke
    delen van een document de lezer wel of niet gezien kan hebben. Gelezen
    blijft een ander verhaal... (geïnformeerd versus 'op de hoogte' zoals
    jij schrijft)."

    BeantwoordenVerwijderen
  2. Dank je Joost, er zit inderdaad nog een verschil tussen "gezien" en "gelezen", dat had ik over het hoofd gezien.

    BeantwoordenVerwijderen
  3. Interessant in dit kader : Technisch bruikbare oplossing voor gebruik oude digitale bestanden juridisch mijnenveld > http://www.kb.nl/nieuws/2012/keep.html (Europese project KEEP (Keeping Emulation Environments Portable) > http://www.keep-project.eu/)

    BeantwoordenVerwijderen
  4. Dank voor je aanvulling alweer Joost.
    Ik heb een tijdje geleden dat Emulation Framework van KEEP gedownload en geïnstalleerd en ben nog niet helemaal overtuigd.  Probleem is en blijft het bedienen van die oude platforms. (En ik ben er wegens I/O-meldingen nog altijd niet in geslaagd een WP 5.1-bestand te openen.)
    Over die juridische problemen heb ik eerder hier als eens wat geschreven: http://eisenduurzaamdigitaaldepot.blogspot.com/2008/12/softwarearchief.html

    BeantwoordenVerwijderen
  5. Wil je dat WP 5.1 bestand openen in dat Emulation Framework of  'op welke manier dan ook' ? Ik moet spontaan denken aan een 'old versions' website,  ik zie dat er inmiddels meer zijn : 10 Websites To Download Older Versions Of Software. Misschien valt WordPerfect 5.1 of een recentere versie te downloaden en installeren op (1) een recente Windows versie en / of (2) denk aan het installeren op een 'bootable' usb-stick met dos en / of (3) in een virtuele omgeving zoals VirtualBox. Veel succes !

    BeantwoordenVerwijderen
  6. Ik wilde ze via EF openen, gewoon als test. De inhoud van deze bestanden is verder niet relevant (en heb ik wel al beschikbaar in ODF (in batch geconverteerd via XENA (http://xena.sourceforge.net/) of stuk voor stuk gewoon in Open Office)
    Maar bedankt voor jouw tips, misschien ga ik daar deze vakantie ook maar eens mee spelen.

    Op 17-04-12 heeft Disqus<> het
    volgende geschreven:

    BeantwoordenVerwijderen
  7. Ook mooi in dit kader : The Geeks Who Saved Prince of Persia’s Source Code From Digital Death. Dit was één van de eerste games die ik me (van) 'op een pc' herinner ! (via Open Trends)

    BeantwoordenVerwijderen