Posts tonen met het label David Bearman. Alle posts tonen
Posts tonen met het label David Bearman. Alle posts tonen

donderdag 12 april 2012

Ik lees, ik lees wat jij niet leest (1)

Nou hebben we de poppen aan het dansen...
Eerder deze week verwees Joost Geraets op BREED naar adaptieve digitale documenten en de promotie van David Smits.

Vroeger was het leven simpel
Alles zag er voor iedereen hetzelfde uit. Even toegespitst op teksten: die begonnen altijd linksboven en liepen dan van links naar rechts, van boven naar beneden. (In sommige taalgebieden was dit andersom, van rechtsboven naar linksonder, maar dat maakt in principe geen verschil.)
En, eenmaal vastgelegd, dan bleef de tekst altijd hetzelfde. Het handschrift van de Beatrijs dat hiernaast staat, ziet er na bijna 640 jaar nog hetzelfde uit, wordt, technisch gezien, nog op dezelfde manier gelezen en de huidige lezer, leest precies dezelfde tekst als de lezer uit 1374.

Digitaal werd langzaam alles anders
Bij digitale bestanden veranderde in het begin niet zo heel veel.
Ja, je kon niet alle bestanden op alle computers gebruiken en de grootte van je scherm bepaalde vaak de pagina-opmaak. Maar de tekst was de tekst en bleef de tekst.
Maar, langzaam ontstond het besef dat er door de digitalisering heel veel veranderde. David Bearman illustreerde (p.29) dit in 2005 aan de hand van een computerspel:
in the mid 1980s I played a computer game, on an Apple IIe computer, that introduced me to the economic and social world of France in the Middle Ages or early Renaissance. I recall, now somewhat vaguely, learning that the money I had accumulated was of no use in obtaining the bride I desired; it would have been far better for me to hold on to economically worthless lands and obtain a silly position in the court. If we wanted to ‘preserve’ this game, as a library, we could obtain the logical design together with the rules and options of play in ASCII text that will be easy to read even fifty years from now. If we wanted to preserve my game as a museum, a video of me playing the game and an Apple IIe computer would probably best document the experience, but the video would need to be migrated to new media and formats to be usable in fifty years. If we wished to preserve the game as an archive, the record of my actual ‘moves’ and their consequences would need to be preserved in a way that was directly tied to the actual game I played; these would be represented independently of the technology in which I played the game. In contrast, if we are interested in preserving the game as functional software, we might adopt a strategy of emulating its operating environment, permitting me to play the game again, but if I did this, it would certainly be with different moves than when I played then.
Interessant is hierbij trouwens dat dit "probleem" zich ook al in de analoge wereld voordoet. Je kunt een doos Monopoly met alle bankbiljetten, kanskaarten, huisjes, hotels en de spelregels bewaren, maar daarmee heb je niet "het spel" bewaard.

362.880x Jef Geys
Maar ook in de stabiele boekvorm kwam je dit al tegen.
Zo heb ik vroeger verschillende boekjes gelezen die als een soort computerspel in elkaar zaten. Ze bestonden uit 500 of meer hoofdstukjes en aan het eind van ieder hoofdstuk moest je kiezen:
Ga je linksaf, ga dan naar hoofdstuk 345, ga je rechtdoor en vechten met het monster, ga dan naar hoofdstuk 192.
Hierdoor was ieder boek natuurlijk voor iedereen anders en de enige manier om vast te leggen "wat er gebeurd is", was door de volgorde waarin je de hoofdstukken gespeeld had, vast te leggen.
Vraagje: Weet iemand of die boekjes nog bestaan en hoe ze heten?

Er waren ook wat meer "high brow-varianten" op dit spel.
Walter van den Broeck, een van mijn favoriete auteurs, heeft in 1970 de roman 362.880 x Jef Geys, een multipel uitgegeven. Hierin wordt een deel van het leven van de Vlaamse kunstenaar Jef Geys beschreven in negen hoofdstukken, vanuit negen verschillende perspectieven. In de allereerste uitgave waren de negen hoofdstukken losse katernen: de lezer kon ze lezen in de volgorde die hij zelf wilde. En deze volgorde bepaalde uiteindelijk welk beeld je van Jef Geys kreeg. (Dat verklaart de titel ook meteen, negen hoofdstukken kun je in 9! = 362.880 verschillende volgordes lezen.) Helaas is de uitgave die ik heb, een gewoon gebonden boek, maar de grap is wel dat de volgorde in iedere herdruk weer anders was.

Hypertext novel
In de jaren negentig waren er ook wel auteurs die experimenteerden met hypertext fictie. De eerste op deze manier vormgegeven en gepubliceerde roman is waarschijnlijk Afternoon, a story van Michael Joyce uit 1990. Je kunt dit boek nog altijd op cd bestellen voor $24,95, maar let op:
This title runs on Macintosh Mac OS X 10.3-10.6 (Panther through Snow Leopard) and on 32-bit Windows XP through Windows 7. It is not yet compatible with Mac OS X 10.7 (Lion) and 64-bit Windows 7. New editions for these systems, and for iPad, are in preparation. 
De eerste roman die op deze manier op het www werd gepubliceerd, zou Sunshine69 van Bobby Rabyd zijn. De site bestaat nog en is heerlijk jaren negentig. Hieronder zie je de pagina Hell's Angels Oaklandcolors.
Draadjesboek
Een ander bijzonder boek is Traumgedanken van Maria Fischer, waarin de hypertext in fysieke vorm wordt weergegeven door middel van gekleurde draadjes.
To ease the access to the elusive topic, the book is designed as a model of a dream about dreaming. Analogue to a dream, where pieces of reality are assembled to build a story, it brings different text excerpts together. They are connected by threads which tie in with certain key words. The threads visualise the confusion and fragileness of dreams.
En dat ziet er dan zo uit:



Morgen meer over het onderzoek van Smits en de mogelijke gevolgen hiervan voor archivarissen...

dinsdag 15 november 2011

Metadata in je plaatjes

Naar aanleiding van een tweet van Edwin las ik dit weekend de discussie op Archief 2.0 over watermerken in afbeeldingen nog eens helemaal. Een paar dingen vallen me nu op.
Een van de argumenten die gebruikt wordt voor het plaatsen van watermerken, is dat daarmee de metadata van de afbeelding te achterhalen zijn. Want:
Wij, archivarissen, besteden veel tijd en geld aan het beschrijven van het beeldmateriaal en vinden het daarom belangrijk dat de herkomst gewaarborgd blijft.
Bob heeft dit argument al grotendeels onderuit gehaald (want een watermerk bevat nauwelijks relevante metadata), maar ik zit ook nog even met de betekenis van het citaat hierboven.
Ja, archivarissen besteden veel tijd en geld (als het goed is bijna al hun tijd en geld) aan het beschrijven van archiefstukken. Maar die beschrijvingen gelden vooral voor de archiefstukken die zij in beheer hebben. Ik vraag me af of archivarissen ook verantwoordelijk zijn voor de metadata van de kopieën van archiefstukken die zij verstrekken aan derden. Naar analogie met een opmerking van Christian: als we een kopietje van een briefje uit een dossier maken, voegen we daar toch ook niet de hele beschrijving uit de inventaris aan toe?

Embedden
Iets anders wat opvalt, is dat de hoop gevestigd wordt op embedden, om op die manier de "link" naar de beheerder te bewaren. Hierbij gaat het om het embedden van het plaatje vanaf de servers van de archiefdienst. Bijvoorbeeld zoals ik eerder een plaatje vanuit Gahetna.nl in een blog over geweren geplaatst heb.
(Overigens en terzijde: het lijkt dus alsof je de foto's vanuit Gahetna.nl niet kunt downloaden, maar in de embed-code staat wel een rechtstreekse url naar het plaatje, waardoor dat bestand dus wel apart opgeslagen kan worden.)

Maar er is natuurlijk nog een andere manier van embedden...
De foto's hierboven en hieronder zijn afkomstig van het BHIC. Je kunt deze foto niet meteen embedden, maar wel downloaden. De foto hierboven is de versie zoals ik die gedownload heb, de foto hieronder heb ik ietwat gemanipuleerd.
Dat zie je niet aan de foto, maar aan de eigenschappen van het bestand. Om dit te zien zijn een paar extra stappen nodig...
Download alletwee de foto's en geef ze een afwijkende naam, open ze in bijvoorbeeld Picasa en bekijk de "Eigenschappen" (alt+enter). Bij de bovenste foto zie je dit:

Maar, bij de onderste foto zie je dit:

In de onderste zeven velden zie je dezelfde beschrijvingsgegevens als bij het BHIC op de website. Ik heb die velden op zondagavond met behulp van PhotoMe een beetje in het wilde weg ingevuld (ik heb ook nog ergens een url toegevoegd, maar die zie ik nu nergens meer terug), dus allerlei gegevens staan er dubbel in. Maar, met wat meer overleg moet het lukken om hier logische afspraken over te maken.

Dus, als we die metadata zo relevant vinden en als we het belangrijk vinden dat duidelijk blijft wat de bron van het plaatje is, is dit embedden dan niet een veel elegantere manier dan een lelijk watermerk?

Overigens, deze methode hoeft natuurlijk niet beperkt te blijven tot foto's, maar kan toegepast worden bij ieder digitaal archiefstuk dat beschikbaar gesteld wordt.

Bronnen en inspiratie
Het bovenstaande heb ik niet zelf verzonnen en is ook helemaal niet nieuw.
Ik moest er aan denken door een blog van de Library of Congres over het toevoegen van beschrijvingen aan foto's. Daarnaast eist een van de Brabantse archiefdiensten iets vergelijkbaar bij de vervanging van bouwvergunningen. Daar moeten in de "scanbestanden" ook allerlei context-data opgenomen worden. (Ik heb niet kunnen achterhalen of ze dit ook al doen bij de foto's uit hun beeldbank.)
En tenslotte is dit ook ongeveer wat David Bearman meer dan vijftien jaar geleden zei, toen hij het had over "metadata encapsulated objects" en de eis dat data-objecten die als records dienen "self documenting" zouden moeten zijn.

maandag 7 november 2011

Het einde van digitale archieven

Foto genomen van zonnevlek AR1339 door Eric Roel gemaakt op 4 november 2011.
Dit is een van de grootste zonnevlekken in jaren
David Bearman hield tijdens CITRA een lezing over "Under-appreciated Threats to the Long-term Preservation of Electronic Archival Records" (dia's, verslagje).
Uiteraard staan er een paar interessante one-liners in de presentatie:


Non-records don’t become records by keeping them


If all records aren’t captured, what is captured is suspect


If capture, use and appraisal metadata doesn’t persist for all records, retained records are suspect


Maar Bearman bespreekt ook een buitenaardse bedreiging, Electro-Magnetic Pulse (EMP), waarbij hij verwees naar het zogenaamde Carrington event: de grootste zonnestorm die tot nu toe is vastgelegd.
Deze "geomagnetic storm" vond plaats op 1 en 2 september 1859 en veroorzaakte poollicht dat zo fel was dat "people in the northeastern U.S. could read newspaper print just from the light of the aurora."
Maar dat is nog tot daar aan toe:
Telegraph systems all over Europe and North America failed, in some cases even shocking telegraph operators. Telegraph pylons threw sparks and telegraph paper spontaneously caught fire. Some telegraph systems appeared to continue to send and receive messages despite having been disconnected from their power supplies.
Begin dit jaar beschreef National Geographic wat de gevolgen zouden zijn als er nu weer een vergelijkbare electro-magnetische storm de aarde zou treffen:
Of particular concern are disruptions to global positioning systems (GPS), which have become ubiquitous in cell phones, airplanes, and automobiles, Baker said. A $13 billion business in 2003, the GPS industry is predicted to grow to nearly $1 trillion by 2017.
In addition, Baker said, satellite communications—also essential to many daily activities—would be at risk from solar storms.
"Every time you purchase a gallon of gas with your credit card, that's a satellite transaction," he said.
But the big fear is what might happen to the electrical grid, since power surges caused by solar particles could blow out giant transformers. Such transformers can take a long time to replace, especially if hundreds are destroyed at once, said Baker, who is a co-author of a National Research Council report on solar-storm risks.
In zo'n geval zijn digitale archieven natuurlijk niet het belangrijkste waar aangedacht moet worden, maar wat in het National Geographic-artikel niet staat: electro-magnetische opslagmedia, zoals harde schijven en tapes, kunnen niet zo goed tegen dat soort electro-magnetische pulsen. Als er geen speciale maatregelen genomen zijn, zal, zodra er weer stroom is om de computers te bedienen, blijken dat die schijven en tapes volledig gewist zijn.

Gelukkig hebben we het papier nog...

Gerelateerd
Als je niet van redundantie houdt, kun je nu naar huis
Een bibliotheek om de beschaving te reconstrueren

Plaatje: Spaceweather.com Vanuit deze zonnevlekken ontstaan de zonnestormen.

woensdag 19 januari 2011

Als je niet van redundantie houdt, kun je nu naar huis

Vanochtend was ik voor mijn college Sam in mijn boekenkast tevergeefs op zoek naar de "Leidraad bij de lessen in het ordenen en beschrijven van archieven". Wat ik wel gevonden heb is het citaat van David Bearman waar ik al een tijdje naar op zoek was:
Records live inside of records. If I forward four documents to a meeting, the meeting record is the four documents - correct? Is somebody sends me a record and I forward it to three of my subordinates, then we now have four records. If I decide, as a matter of business risk, that the transactions in which we are involved are transactions for which that record needs to be retained for a certain period of time, I will retain four records for that period of time. Those of you who do not like redundancy can go home.
Dit moet ik meer dan tien jaar geleden voor de eerste keer gelezen hebben, want het komt uit de reader voor het college Digitaal archief 1998-1999. Ondertussen  was die laatste zin in mijn hoofd getransformeerd tot: "If you don't like redundancy, then you are in the wrong business."

Maar de portee van het zinnetje blijft gelijk: digitale archiefstukken hebben de neiging zich te reproduceren, maar dat ze 'inhoudelijk' gelijk zijn, betekent niet dat ze identiek zijn. Het zit allemaal in de context...

O ja, voor de volledigheid, het zinnetje komt uit Bearman, David, "Archival Issues in a Computing Environment." In: Yorke, Stephen, Playing for Keeps. The Proceedings of an Electronic Records Management Conference Canberra, 8-10 November 1994. Canberra, 1995. 233-255.
(Het is een interessant artikel dat helaas niet meer online lijkt te staan. Het is hier op 19 mei 1999 voor het laatst gezien.)

Aanvulling 19:35
Ik heb blijkbaar niet goed genoeg gezocht, zoals je hierbeneden kunt zien, heeft Ton de Looijer de Proceedings met de lezing wel gevonden. Dank je Ton.

Gerelateerd
E-mail reproductie

Plaatje: Redundancy van Mlcastle