Posts tonen met het label duurzame toegankelijkheid. Alle posts tonen
Posts tonen met het label duurzame toegankelijkheid. Alle posts tonen

donderdag 27 juni 2013

Vergeet het!

Vorige week las ik over ForgetIt, dat ook onder dat programma valt.
While preservation of digital content is now well established in memory institutions such as national libraries and archives, it is still in its infancy in most other organizations, and even more so for personal content. ForgetIT combines three new concepts to ease the adoption of preservation in the personal and organizational context, each overcoming major obstacles:
  • First, Managed Forgetting models resource selection as a function of attention and significance dynamics. It is inspired by the important role of forgetting in human memory and focuses on characteristic signals of reduction in salience. For this purpose it relies on multi-faceted information assessment and offers customizable preservation options such as full  preservation, removing of redundancy, resource condensation, and also complete digital forgetting.
  • Secondly, Synergetic Preservation crosses the chasm that exists between active information use and preservation management by making intelligent preservation processes an integral part of the content lifecycle in information management and by developing solutions for smooth bi-directional transitions.
  • Thirdly, Contextualized Remembering targets keeping preserved content meaningful and useful. It will be based on a process of dynamic evolution-aware contextualization, which combines context extraction and packaging with evolution detection and intelligent re-contextualization.
[...]
The main expected outcomes are the flexible Preserve-or-Forget Framework for intelligent preservation management and, on top of it, two application pilots: one for personal preservation focussing on multimedia coverage of personal events and one for organizational preservation targeted at smooth preservation in organizational content management.
Dat is een hele mond vol, maar interessant genoeg om in de gaten te houden. Maar de naam van het project vind ik toch een beetje twijfelachtig.

Gerelateerd
BlogForever
Bewaar als... Een praktische leporello
Delete. Onthouden of vergeten in de digitale wereld.
Opslag wordt steeds goedkoper, dus laten we alles maar bewaren

En ook nog:
Digitaal duurzaam voor de gewone man
Digitale archivering bij de mensen thuis

Het plaatje komt van de ForgetIt-site

donderdag 6 juni 2013

vrijdag 19 april 2013

Gekocht en geluisterd: Files that last

Gisteren het ebook Files that last van Gary McGath gekocht. Met de coupon code kun je het tot morgen bij  Smashwords downloaden voor iets meer dan €5,- Daarna kost het een euro of 7.
Ik heb het boek tot nu toe alleen nog maar doorgebladerd, maar de inhoudsopgave ziet er veelbelovend uit.
McGath heeft trouwens ook nog wat liedjes geschreven over digitale duurzaamheid, zoals deze
Files that last: The song

I had a little Kindle, it had a little book.
Today the book has vanished. I think that I’ve been took.
They say I never owned it, no not a single page.
The only thing it kindles is my rage.

Chorus:
   I want some files that last, data that will not stray.
   Files just as fresh tomorrow as they were yesterday.
I wrote a little fanfic just seven years ago.

But how to read the file now, my PC doesn’t know.
My brilliant tale is only a bunch of useless bits,
Why do I have to put up with this … inconvenience?

Chorus

I made a little archive all stored on DVDs
And put them in the car trunk, where they could fit with ease.
The summer’s warm and sunny, and sadly I have learned
That’s not how DVDs ought to be burned.

Chorus

The road to preservation has potholes everywhere,
I’m trying hard to dodge them and taking extra care.
To give my files a future, I won’t forget the past.
There has to be a way to make them last!

Chorus, twice
Gerelateerd
Bewaar als... Een praktische leporello

vrijdag 7 december 2012

Delete. Onthouden of vergeten in de digitale wereld

Vroeger was onthouden moeilijk en was vergeten de norm.
Tot niet eens zo heel lang geleden beschikten slechts enkele mensen over de middelen en kennis om gebeurtenissen “vast te leggen”. Eigenlijk wisten ook alleen de mensen die bij een gebeurtenis aanwezig waren geweest, wat er echt gebeurd was. Aangezien het geheugen ook toen al onbetrouwbaar was, werden allerlei manieren verzonnen waardoor de aanwezigen zich later een belangrijke gebeurtenis beter zouden herinneren. Tot niet eens zo heel lang geleden werden getuigen letterlijk aan hun oor getrokken in de hoop dat ze zich op die manier beter herinnerden wat ze gezien en gehoord hadden:
‘“Ende omme het selfde verkoop en over dragt van eigendom te beter te onthouden was een gewoonte de jongens ten oirconden van dien bij de ooren te grijpen ende te reck-ooren” Orlers Leyden 26 Een overoud gebruik! Het heerschte nog in de vorige eeuw in verschillende streken van Duitschland ook bij andere gewigtige aangelegenheden bij ‘t leggen van den eersten steen het zetten van den grenssteen enz. De knapen ontvingen daarbij kleine geschenken. Uitsluitend in Beijeren werden voor ‘t gerigt de volwassen getuigen aan ‘t oor getrokken; dit duurde tot ongeveer 1180 en wel bij aankoop van grondbezit enz’
(M.J. Noordewier, Nederduitsche Regtsoudheden, p.36. Via Google Books)
Van der Gouw beschreef in Munimenta en Monumenta, zijn afscheidscollege in 1980, de ontwikkeling van geheugensteuntjes (monumenta) naar schriftelijke rechtsbewijzen (munimenta). De geheugensteuntjes zijn (schriftelijke) “getuigenissen” die soms in rechtsbewijzen kunnen veranderen, bijvoorbeeld “door middel van
erkenning vanwege de tegenpartij.” Maar er zijn ook munimenta die puur als rechtsbewijs worden opgesteld: het charter, met zegels en ‘onomstreden’ bewijskracht, was en is daar het ultieme voorbeeld van.
In Delete. The virtue of forgetting in a digital age beschrijft Victor Mayer-Schönberger een andere ontwikkeling: van een beperkt aantal mensen die een beperkte hoeveelheid geheugensteuntjes vastleggen naar bijna volledig onthouden door iedereen. Want, zo betoogt Mayer-Schönberger, tegenwoordig is het makkelijker (en goedkoper) om (digitale) informatie te onthouden, dan om deze te vergeten. Hij illustreert dit onder andere aan de hand van digitale foto's. De meeste mensen kopiëren gewoon alle foto's die ze genomen hebben naar de harde schijf van de pc, omdat de tijd die het kost om te selecteren 'te duur' is in vergelijking met de extra ruimte die de foto's innemen. En het gaat natuurlijk niet alleen om wat particulieren op hun eigen pc’s bewaren: overheden bewaren steeds meer gegevens digitaal (hij verwijst expliciet naar het elektronisch patiëntendossier), Google bewaart niet alleen alle zoekopdrachten, maar ook de e-mails van miljoenen mensen en Amazon bewaart niet alleen welke boeken je echt gekocht hebt, maar ook naar welke boeken en andere producten je alleen naar gekeken hebt. Door dit alles wordt 'onthouden' de standaard en vergeten de uitzondering, terwijl dit de afgelopen millennia juist andersom was: mensen moesten vroeger moeite doen om dingen te onthouden.
De belangrijkste reden waarom Mayer-Schönberger zich hier zo druk om maakt, is dat 'vergeten' nodig is om te kunnen functioneren en leren. Er zijn mensen die lijden aan hyperthymesia. Dit betekent kortweg dat ze alles onthouden: de inhoud van individuele afleveringen van soapseries, het avondeten van iedere dag van hun leven en iedere beslissing (klein en groot) die ze ooit genomen hebben. Een van de gevolgen daarvan is dat ze nauwelijks normaal kunnen functioneren: ze kunnen nauwelijks abstract denken en bij iedere beslissing worden alle vorige beslissingen betrokken, wat vaak tot besluiteloosheid leidt. Mayer-Schönberger betoogt dat dit voor de hele menselijke beschaving zou gaan gelden, omdat er steeds meer digitaal bewaard wordt en we ook steeds meer gebruik gaan maken van dit volledige, externe geheugen.
Als oplossing voor dit probleem stelt hij in Delete voor om aan alle digitale informatie bij opslag een uiterste houdbaarheidsdatum toe te kennen. Na die datum zou de informatie (bij voorkeur automatisch) vernietigd moeten worden. Een beetje zoals we tegenwoordig ook over archiefstukken nadenken: bij de creatie van een archiefstuk zou al vastgesteld moeten worden wanneer het vernietigd moet worden.
Hoe zou dat dan in zijn werk gaan? Nou zo bijvoorbeeld:
"Suppose somebody takes a picture of you. If seen as an information transaction, the expiration date for such a picture ought to be set jointly between the picture taker and yourself. Rather than haggling over it in person, the negotiations over expiration dates could be done electronically. Each digital camera could have a built-in process to select expiration dates (perhaps through an easy preset). Before taking a picture, the camera sends out a "picture request." Imagine further that we carry with us small "permission devices" (the size of key rings) that when receiving such a "picture request" respond with the owners preferred expiration date. (...) When the picture is taken it is stored with the shortest of all expiration dates received." Delete., p.188
En dit soort onderhandelingen moet je dus iedere keer (al dan niet persoonlijk) voeren met iedereen waarmee je informatie deelt. Dat lijkt me niet erg realistisch.

Hoewel Mayer-Schönberger zijn best doet om uit te leggen waarom we niet meer 'vergeten', waarom vergeten wel belangrijk is en welke strategieën mogelijk zouden zijn om dit weer te realiseren, valt het boek toch tegen. Dat heeft twee redenen.
De eerste is dat hij zijn boek heeft opgehangen aan drie praktijkgevallen, twee waar gebeurd en één fictief, die niets te maken hebben met zijn voorgestelde oplossing. Het boek begint met het relaas van Stacy Snyder die geen onderwijsbevoegdheid krijgt, omdat ze op haar MySpace-pagina een foto van zichzelf heeft gezet met als onderschrift “Drunken Pirate”. De school vond dit geen goed voorbeeld voor de kinderen die eventueel les van haar zouden krijgen en besloot haar daarom geen diploma te geven.
De andere waar gebeurde casus gaat over Andrew Feldmar, een Canadese psycho-therapeut, die de VS niet meer in mag. Toen hij in 2006 aan de Canadees-Amerikaanse grens werd aangehouden, googlede een overijverige douane-beambte zijn naam. Blijkbaar zat een artikel uit 2001 over het gebruik van LSD door Feldmar toen bij een van de eerste zoekresultaten. Hierop werd hij als druggebruiker geregistreerd en mocht hij de VS niet meer in. (Ironisch genoeg staat het bewuste artikel nu trouwens niet op de eerste tien pagina's met zoekresultaten)
Uiteraard is het absurd dat Snyder geen onderwijsbevoegdheid krijgt en dat Feldmar de VS niet meer in mag, maar een uiterste houdbaarheidsdatum zou dit toch niet hebben voorkomen?
Het is namelijk zeer de vraag hoe lang de Piraten-foto op MySpace gestaan heeft, voordat de schoolleiding deze zag. Een houdbaarheidsdatum van één dag kan al genoeg zijn...
En Feldmar publiceerde zijn artikel vrijwillig in een wetenschappelijk tijdschrift (dat later integraal online verscheen). Het idee daar achter is juist dat zo veel mogelijk mensen het nu en in de toekomst kunnen lezen. Hoe schokkend en triest deze voorbeelden dus ook zijn, ze worden niet 'opgelost' door houdbaarheidsdata.
Het derde voorbeeld is een fictief geval, waarbij ene Jane na een paar jaar een oude vriend weer eens tegen komt. Na enig heen en weer e-mailen besluiten ze samen wat te gaan eten en Jane wil voorstellen om af te spreken in het restaurant waar ze jaren geleden al eens gegeten hebben. Ze bladert door haar oude e-mails in haar mailbox om de naam van de restaurant te achterhalen en leest zo ook weer dat ze een paar jaar geleden slaande ruzie met elkaar gehad hebben. Dat was ze helemaal vergeten, maar nu ze het weer heeft gelezen, twijfelt ze over haar afspraak.
Dit had misschien voorkomen kunnen worden door een houdbaarheidsdatum aan die e-mails te koppelen, maar ook dan is het de vraag of die kort genoeg zou zijn geweest. Daarnaast is dit natuurlijk helemaal geen digitaal probleem, want als Jane analoog met die vriend had gecorrespondeerd, had ze de brieven misschien ook wel bewaard en doorzocht en was precies hetzelfde gebeurd.
De tweede reden waarom het boek tegenviel is dat de oplossing ook wel erg idealistisch en 'far fetched' is, ook al ontkent Mayer-Schönberger dat zelf.
Want neem nu het geval Feldmar. Hij zal nog een hele tijd te boek blijven staan als die LSD-gebruiker (die de VS niet in mag). Niet omdat hij twaalf jaar geleden hierover een artikel in een obscuur tijdschrift schreef, maar omdat sinds 2006 duizenden, van grote kranten tot kleine bloggers, over hem geschreven hebben. Moeten die allemaal met Feldmar in onderhandeling over de houdbaarheidsdatum? Of wordt er door iemand (maar wie dan?) gewoon een maximum termijn gesteld? Als die termijn erg kort is, wordt het censuur en als die termijn lang is, heeft het weinig zin.

Vroeger was onthouden makkelijk, herinneren was de norm.
Maar Mayer-Schönberg ziet nog iets over het hoofd, want het was vroeger een stuk eenvoudiger om al die geheugensteuntjes te bewaren.
Bij haar overlijden in 1997 liet de dichteres Ida Gerhardt haar literaire erfenis na, bestaande uit een gigantische hoeveelheid manuscripten, krantenknipsels, correspondentie en een bibliotheek. De erfgenamen brachten het allemaal onder in het stadsarchief van Zuthen.
Het interessante was dat de bibliotheek om twee redenen een integraal deel uit maakte van het archief. Aan de ene kant omdat Gerhardt de boeken gebruikte om brieven en ansichtkaarten in op te bergen. De bibliotheek was dus een cruciaal onderdeel van de archiefordening.
Maar nog interessanter is dat de boeken duidelijk deel uit gemaakt hebben van het werkproces van de schrijfster. In de marges van heel veel boeken heeft ze aantekeningen gemaakt en regelmatig staan er zelfs eerste versies van gedichten genoteerd.
Om die reden is er destijds naar een manier gezocht om de bibliotheek en de erin gevonden archiefstukken integraal te beschrijven, inclusief de bergplaatsen van documenten en de vindplaats van aantekeningen.
Maar stel nu eens dat Gerhardt een Kindle van Amazon als ereader had gehad? Dan waren de erfgenamen en het Zutphens archief snel klaar geweest, omdat er nauwelijks een literaire en ieder geval geen bibliothecaire erfenis zou zijn geweest. En dat lag dan niet eens aan de traditionele technische problemen van de digitale duurzaamheid.
Het gaat er ook niet om dat je in een Kindle geen ontvangen correspondentie kunt bewaren of aantekeningen in boeken kunt maken, want dat kan alletwee wel. Je kunt eigen bestanden er naar toe uploaden en je kunt annotaties maken in de boeken die je leest. Het is zelfs mogelijk om die annotaties openbaar te maken, zodat andere Kindle-gebruikers die hetzelfde boek later lezen, ze ook kunnen zien. (Ik denk trouwens dat Gerhardt dat gruwelijk zou hebben gevonden.)
Het probleem zit in het eigendom van de boeken op de Kindle. Als je bij Amazon boeken “koopt”, worden de digitale bestanden niet jouw eigendom. Je betaalt voor een licentie om de bestanden te mogen gebruiken. Of, zoals Amazon in de gebruiksvoorwaarden zegt: “Kindle Content is licensed, not sold, to you by the Content Provider.”
Dit betekent bijvoorbeeld dat Amazon het recht heeft om je jouw boeken weer af te pakken, zoals een paar jaar geleden bleek toen het bedrijf ontdekte dat hij een illegale digitale versie van 1984 verkocht. Maar het betekent ook dat je je boeken niet aan iemand anders kunt geven, ook niet na je dood. En als je geen boeken kunt nalaten, kun je ook geen aantekeningen en gedichten in ontwikkeling nalaten.
Maar natuurlijk onthoudt ook “het internet” niet zo onbeperkt als Mayer-Schönberg suggereert. Dat bleek bijvoorbeeld uit een onderzoek van de Web Science and Digital Libraries Research Group van de Old Dominion University. De onderzoekers wilden weten hoeveel social media-berichten er na een jaar nog over waren van alle berichten die tijdens de Egyptische Revolutie van januari 2011 waren gepost. Hun conclusie is dat na een jaar iets meer dan 10% van links, video’s en foto’s weg is. Het zou interessant zijn om dit onderzoek nu bijna nog een jaar later, te herhalen. Hoogstwaarschijnlijk is er er dan nog veel minder over.
Maar ook minder vluchtige internet-publicaties doorstaan de tand des tijds vaak niet of nauwelijks. De in 2009 bij gelegenheid van het 400 jarig “bestaan” van New York door het ministerie van Buitenlandse Zaken gemaakte website www.ny400.nl bestaat niet meer. En, o ironie, ook de prachtige site www.digitaleduurzaamheid.nl van het Nationaal Archief is opgedoekt en verwijst nu rechtstreeks door naar www.nationaalarchief.nl. Al kun je van www.digitaleduurzaamheid.nl, in tegenstelling tot www.ny400.nl nog wel kopieën vinden bij The Internet Archive.

Kortom, ondanks alle terechte bezwaren van Mayer-Schönberger, lijkt me dat vergeten nog altijd de norm is, omdat er voor bewaren en onthouden toch nog altijd extra inspanningen noodzakelijk zijn.

Dit artikel verscheen in het Archievenblad van december 2012 en is een bewerking en aanvulling van mijn blogbericht uit december 2009: Delete. The virtue of forgetting in the Digital Age - Viktor Mayer -Schönberger

Gerelateerd
De boekhandel die je hele boekenkast verwijdert
E-readen of toch maar a-lezen
Vergeet mij toch

Plaatjes: foto's van het archief van Ida Gerhardt die ik zelf gemaakt heb en When will we forget 

dinsdag 11 september 2012

Niveaus van digitaal beheer

De leden van de National Digital Stewardship Alliance, dat is de Amerikaanse oudere zus van onze NCDD, heeft de afgelopen maanden nagedacht over de niveaus van "digital preservation" die je zou kunnen onderscheiden. Ze hadden geconstateerd dat er allerlei informatie was over bijvoorbeeld personal digital archiving en dat ook de eisen voor een volwaardig digitaal depot ook wel bekend zijn.
However, the working group felt there was a lack of solid guidance on how an organization should prioritize its resource allocation between these two ends of the spectrum.
Daarom hebben ze nu een schema waarin de verschillende niveaus die je zou kunnen onderscheiden staan beschreven:

The overall idea with the document is that all the things in the first level are either necessary prerequisites for things in the second to fourth levels or are themselves the most pressing things to address. To some extent, the goal for this diagram is that you could use it to start getting your proverbial digital boxes off the floor, and then work your way up to level four where you are much more protected against risk of loss.
Het concept staat hier en je mag het becommentariëren.

Ik vind het idee hoe dan ook geweldig, omdat ik ook de indruk heb dat heel veel organisaties eigenlijk geen idee hebben hoe ze zouden moeten beginnen.

Gerelateerd
Bewaar als... Een praktische leporello
Zonder jurk niets om te doen opwaaien

Plaatje: Niveau Creme van Datreuffel

maandag 6 februari 2012

Digitale editietechniek

Vorige week schreef ik over de historisch-kritische editie van Max Havelaar die ik gelezen had. De tweede band daarvan bestaat voor het overgrote deel uit variantenapparaat. Dat wil zeggen dat zo goed als iedere(!) afwijking tussen handschrift, eerste, tweede, tweede dubbeldruk, derde, vierde en vijfde druk wordt gedocumenteerd. Kets-Vree beschrijft in de verantwoording hoe dat in sommige gevallen gaat. Diverse pagina's van de tweede druk en de tweede dubbeldruk zijn geprint op "overtrek-papier" en daarna op elkaar gelegd op een lichtbak. Hierdoor waren afwijkingen per pagina snel en makkelijk zichtbaar.
Afgelopen week stond in The New York Times een beschrijving van de digitale variant van dit procédé: 189 floppies uit de nalatenschap van Jonathan Larson.
Mij zei die naam niks, maar in Amerika is hij blijkbaar heel beroemd als de auteur van de musical Rent, die door Wikipedia omschreven wordt als
a rock musical with music and lyrics by Jonathan Larson[1] based on Giacomo Puccini's opera La bohème. It tells the story of a group of impoverished young artists and musicians struggling to survive and create in New York's Lower East Side in the thriving days of Bohemian Alphabet City, under the shadow of HIV/AIDS.
In 2000 en 2001 was de musical ook in Nederland te zien.
Larson stierf enkele dagen voor de première van de musical en enkele jaren na zijn dood werd zijn nalatenschap gedoneerd aan de Library of Congress. En behalve uit papieren, bestond deze ook uit diskettes.
Hier vind je de hele plaatsingslijs/inventaris, die als pdf bestaat deze uit 31 pagina's. Het archief bevat vijf dozen(!) met Electronic Files, 1990-1996 die als volgt zijn beschreven:
BOX 53-57 Electronic Files, 1990-1996
BOX 53-55 3 1/2" discs
BOX 55-56 5 1/4" discs
BOX 57 Computer manuals
Als het om papieren documenten zou gaan, kun je dit vergelijken met: "3 dozen A4-tjes en 2 dozen A3-tjes."
Een paar jaar geleden heeft Doug Reside zich het lot van die floppy's aangetrokken. Eerst heeft hij alle bestanden gekopieerd naar een stabielere omgeving, waarna hij met behulp van een emulator de bestanden bekeek zoals Larson ze ook gezien zou hebben.

Maar toen Reside een van de laatste versies van Rent opende met TextWrangler, een eenvoudige text-editor, kwam hij tot een rare ontdekking. Om voor hem overklaarbare redenen week de tekst af van de tekst die hij in de emulator zag!
It turns out early versions of Microsft Word had a setting called "fast save" to speed up the frequent action of writing to a file (a slow process in those days of floppy disks and computers that ran only about 2% as fast as today’s iPhones). "Fast save" worked by appending revisions to the end of a file rather than completely overwriting the existing the text. Word 5.1 knew to look for these revisions and integrate them into the main text when the file was opened. A text editor, on the other hand, just opens the text as it finds it. When these files are opened with a software tool called a hex editor, though, it's possible to look at the groups of text that represent the revisions recorded in a single "fast save."
Fascinerend, maar eigenlijk voor de Google Docs gebruiker weinig verrassend, omdat daarin dit soort "versie-beheer" standaard gebeurt. Maar aan de andere kant, die diskettes zijn in ieder geval nog bij de Library of Congres terecht gekomen. Stel dat een auteur Google Docs gebruikt, hoe krijg je als onderzoeker na zijn dood dan toegang tot die account?

Gerelateerd
De Mac van Rushdie
Lokalisatie Literair Archief (Lolita)
Monumentale accounts
Digitale antiquiteiten

Plaatje: Balancing floppies van Oxtopus

vrijdag 27 januari 2012

Pas op een wolf! #hvog

Sinds een paar dagen speelt deze fabel van Aesopus constant door mijn hoofd en het NCDD-symposium heeft dat niet minder gemaakt.
Twintig jaar geleden verscheen Machineleesbare gegevensbestanden: archivering en beheer bij het Rijk van de Algemene Rekenkamer. De teneur van dit rapport over "digitale duurzaamheid" was: het is vijf voor twaalf, er moet nu echt iets gebeuren anders raken we heel veel digitale bestanden en archieven kwijt.
Ik citeer de aanbevelingen (p.31-32):
  1. Eigenaren van MLG's dienen een schriftelijk vastgelegd bewaarbeleid te ontwikkelen voor MLG's
  2. Bescherming van gegevens moet onderdeel uitmaken van dit bewaarbeleid
  3. Mogelijkheden van secundair gebruik van MLG's dienen meer aandacht te krijgen
  4. De regelgeving op het terrein van de archivering en het beleidskader moeten worden toegesneden op het archiveren van MLG's. Voortvarendheid is hierbij op zijn plaats.
  5. De Algemene Rijksarchivaris zou ten behoeve van de politieke meningsvorming over de mate waarin en de wijze waarop MLG's voor het cultuurhistorisch erfgoed van belang zijn een standpunt dienen te formuleren over het vraagstuk van het beheer van gearchiveerde MLG's
  6. Inzicht in de creatiekosten en de archiveringskosten van MLG's moet vergroot worden
  7. Aan het archiveringsaspect moet al in de ontwikkelingsfase van een informatiesysteem aandacht worden besteed
  8. Wanneer de eigenaar gebruik maakt van de diensten van een rekencentrum, moeten - schriftelijk vastgelegde - afspraken over het beheer en de archivering van MLG's worden gemaakt.
Sinds die tijd roepen wij archivarissen en inspecteurs uit volle borst en om de haverklap dat er nu toch echt iets moet gebeuren om de duurzame toegankelijkheid van digitale bestanden te garanderen, want anders raken we heel, heel veel kwijt en kunnen we ons HANDELEN NIET VERANTWOORDEN!
Ik wil hier niet suggereren dat we dit met kwade opzet doen, we zijn allemaal integer en bedoelen het allemaal heel goed.
Maar lopen we niet het risico dat we net als Gonzo niet meer geloofd worden?
Hoeveel is er de afgelopen jaren kwijt geraakt dat echt pijn heeft gedaan?
Ik kan me eigenlijk alleen het debacle met de Arbeidsvoorziening en de ESF-gelden herinneren. Dat heeft een paar miljoen gekost (en daar heeft de Rijksarchiefinspectie destijds nog een interessant rapport over geschreven.) Maar al met al heeft dit weinig blijvende indruk gemaakt, waard00r onze waarschuwingen vooral de indruk wekken paniekzaaierij te zijn.
Dinsdag bij het NCDD-symposium heb ik het eerste deel van de "break-out sessie" over preservation meegemaakt en in die drie kwartier ging het nauwelijks over preservation. Het enige dat er een beetje over ging was dat het niet verstandig is om spaties in je bestandsnamen te gebruiken...
De rest van de tijd ging het over nare IT-afdelingen en bestuurders en managers die maar niet snappen dat duurzame toegankelijkheid belangrijk is. Die mensen snappen niet dat we HEEL VEEL INFORMATIE KWIJT RAKEN! En het lijkt erop dat wij denken dat ze het wel zullen snappen, als we dat maar vaak genoeg herhalen.

Ik denk dat we ondertussen moeten concluderen dat het waarschuwen voor wolven de afgelopen twintig jaar nauwelijks effect heeft gehad en wel eens tegen ons zou kunnen gaan werken. We hebben dus ook een Cousin Norman nodig!

Ik weet alleen nog niet hoe die eruit zou moeten zien...

Gerelateerd
Strategische agenda van de NCDD

maandag 21 november 2011

Bewaar als... Een praktische leporello


Digitale duurzaamheid lijkt ingewikkelder dan het is. Natuurlijk is het lastig en moet je er ook wel wat moeite voor doen. Maar zelf kunnen beslissen welke informatie, foto’s, filmpjes of projecten je over een aantal jaren nog tot je beschikking hebt, is toch ook wat waard. Er zijn een paar eenvoudige stappen waar je mee kunt beginnen. De inspanning hoeft niet groter te zijn dan het resultaat dat je wilt te behalen; over een jaar of twintig nog beschikken over een digitale geheugen
De volgende maatregelen neem je direct:
  1. Kies goede bestandsnamen
  2. Kies goede bestandsformaten
  3. Kies een goed passende strategie
  4. Orden en selecteer
Tot slot plan je jaarlijks onderhoud in.
Lees meer op Bewaar als... een handleiding digitaal archiveren voor ontwerpers van Premsela.org en de BNO, gemaakt door Karen van der Heiden. Eerder maakten zij ook al de "Beknopte handleiding archiveren voor ontwerpers."

Gerelateerd
Archiveren voor ontwerpers
Zonder jurk niets om te doen opwaaien

donderdag 18 augustus 2011

1000memories bewaart je foto's voor eeuwig



1000memories.com belooft je foto's voor altijd te bewaren:
We know that forever is a challenge to guarantee. That said, we take the trust you place in us very seriously and do everything we can to make sure that your photos, stories and memories will be here for future generations.
We have taken several extraordinary steps to ensure that your memories will never be deleted:
  • It is our policy to preserve your memories. On 1000memories, your account cannot expire, and we will never delete your photos, stories or memories (though you are free to do so yourself)
  • We use the world's best data centers and data center technologies to protect and store your data. The data centers are audited and accredited to the same standards that banks use to store and protect your data. In the event that one data center shuts down, we store multiple copies of all of the content on 1000memories to ensure that if something ever happens to one copy, we have backups ready to go 
  • We let you make unlimited copies of memory page content to store offline. We have an easy-to-use data export feature that lets you download your memory page at a click of a button, then save copies wherever you’d like. We wrote a bit more about it here 
  • We are taking steps to make 1000memories content a part of official history by partnering with digital library systems. For instance, the Egypt remembers page was recently added to the official Internet Archive Collection of the Library of Congress and Bibliotheque Nationale
This is only the beginning. It is our mission to provide a safe place for your memories so that they can be passed down to future generations. This is as close to a permanent space for your memories that you’ll ever find on the Internet. And it should be.

dinsdag 31 mei 2011

OAIS discussion guide

Begin dit jaar heeft de "Interagency Science Working Group" van NARA een "discussion guide" (pdf) gepubliceerd, die gebruikt kan worden om vast te stellen in hoeverre een organisatie voldoet aan de OAIS-criteria. In de handleiding worden de zes hoofdprocessen van OAIS (Ingest, Archival Storage, Data Management, Administration, Preservation Planning en Acces, in ED3 vertaald als opname, lange termijn opslag, toegankelijk maken, beheer, bewaarstrategie en toegang) behandeld aan de hand van open vragen.
This guide provides a series of high-level, open-ended questions related to each of the six OAIS business processes. The questions are designed to help a team or group of agency managers, staff, and subject matter experts identify policy, procedures, and operational areas for which agency guidance exists, where gaps in policies, procedures and operations exist, and where revisions to policies and procedures are needed to meet OAIS criteria for long-term preservation and access to digital records and information.
The questions should be discussed in a meeting or interview with agency staff to assure that everyone understands the processes and the underlying questions, and is familiar with OAIS terminology. To answer the questions, it may be helpful to select one dataset (or one continuing series of datasets that are the same) and walk through your data repository’s lifecycle processes, from data creation, storage or maintenance, access, preservation, to eventual disposal or transfer to NARA.
[...]
Using this guide can benefit your agency by improving communications among knowledgeable staff regarding specific issues, questions or processes related to long-term preservation and access to digital data.
De handleiding is dus duidelijk niet bedoeld als norm of richtlijn, maar veeleer als hulpmiddel om bewustwording, onderling begrip en focus te creëren. Dat blijkt ook duidelijk uit de vragen die gesteld worden. Die zijn redelijk "high-level":
Ingest
3. Has your agency defined what metadata must be saved when the data are initially created? Does the repository have additional or supplementary metadata requirements?
Data Management Process
2. Are there policies in place governing who has access to create, read, use and delete the descriptive information and administrative data?
De vragen wekken de indruk beperkt te zijn, het zijn er 28, maar dit is maar schijn. Sommige vragen bestaan uit wel vier deelvragen.

De laatste vraag die bij ieder onderwerp gesteld wordt is sympathiek en verwarrend tegelijk:
What are the most significant current challenges in your agency’s repository for the archival storage function (e.g., financial resources, personnel, policies, procedures, oversight, and compliance)? To what extent do these challenges impact your agency’s ability to conduct the activities in this process? How could NARA advocacy and guidance help your repository or agency address these challenges?
Sympathiek, omdat het NARA hiermee expliciet aangeeft dat hij federale diensten kan en zal ondersteunen bij het zoeken naar oplossingen. Verwarrend omdat deze vraag meer de indruk wekt uit een enquete te komen, dan deel uit te maken van een "zelf-onderzoek."

Gerelateerd
Open koffie voor Jeroen
Duurzame toegankelijkheid en buitenaardse wezens
Gezamenlijke e-depotvoorzieningen

vrijdag 13 mei 2011

Digitale antiquiteiten


By 2036, data loss has become a thing of the past. All digital media is instantly uploaded to the internet and permanently stored in the cloud, safely backed-up on servers scattered around the world. Only a handful of small businesses in the world have the expertise to recover data from pre-cloud devices. On a hot summer day, a young man named Kai visits Digital Antiquities, a store in eastern Pennsylvania specializing in data recovery and sales of vintage electronics. He shows Cat, the store’s only employee, an old compact disc left to him from his deceased mother and asks her to recover its contents. Will Cat help him find a working CD reader? And what will they discover among the contents of the disc?
Mooi gemaakte film voor als je een kwartiertje over hebt, met heel mooie muziek en 'n beetje 'n tuttig eind. Zie meer op Futurestates.tv

Gerelateerd
Waarom digitale duurzaamheid belangrijk is voor jou

PS
Deze blog is een beetje op de valreep, aangezien Blogger sinds gisteren off line was. De blog van gisteren is nog offline, maar ik heb hoop dat hij nog gered wordt.

donderdag 5 mei 2011

But the era of the paper record is almost over


And so we need to be able to have a place to store those things where they're no longer trapped on the particular media on which they're originally stored or created. Websites, wiki's and blogs, Twitter feeds, all of these things are being used by federal agencies now to communicate with the public and they're creating federal records. The Electronic Records Archives, ERA, gives us a way to bring in the records, it gives us a place to store the records safely and preserve them.

maandag 18 april 2011

Duurzame toegankelijkheid en buitenaardse wezens

Wie kan, zonder te spieken, lezen wat hieronder staat?
Arecibo message light
Een van de cruciale onderdelen van het OAIS-model is representation information, Alan Ake schrijft daarover:
The Data Object itself, in a digital repository, is simply a string of bits. What the Representation Information does is convert (or tell us how to convert) these bits to something more meaningful. It describes the format or data structure concepts which should be applied to the bit sequences which in turn result in more meaningful values, such as characters, pixels, tables etc.

This is termed structure information. Ideally Representation Information should also contain semantic information, eg what human language the text is written in, what any scientific terminology means, and so on (4.2.1.3.1). By including both structure and semantic information we are future-proofing ourselves as much as possible.

Preservation of RI is most easily done when the Representation Information is expressed in an easily understandable form, “such as ASCII” (4.2.1.3.2). What the Model is saying here is that it would be stupid to save the Representation Information in, say, a proprietary or weakly-supported file format, even if the Data Object itself is in such a format. The Representation Information can be printed out onto paper, if that helps.
En stel je bent na 1985 geboren, zou je dan nog weten wat je met deze schijf moet doen?

Dus, als we nu al niet meer snappen wat we een jaar of veertig geleden de ruimte in hebben gestuurd, hoe zorgen we dan dat we over, zeg honderd jaar nog een pdf-bestandje kunnen begrijpen?

maandag 21 maart 2011

Personal Digital Archiving 2011

24 en 25 februari vond het congres Personal Digital Archiving 2011 plaats bij Archive.org. Daar zijn nu ook alle 46 (!) presentaties te bekijken.
Voor de rustige avonden en weekends, als er toch niets op tv is...

Zie voor meer links de pagina van Personal Digital Archiving

Plaatje: PDA sign van Rich Gibson

maandag 24 januari 2011

Archiveren voor ontwerpers

Via een tweet van Karin van der Heiden kwam ik A Concise Guide to Archiving for Designers tegen. Het boekje is een vertaling van Beknopte handleiding archiveren voor ontwerpers en omvat tien tips:
  1. Do not keep everything. Archiving is identifying.
  2. Keep the process, not only the final result.
  3. Keep items that belong together, together. Archiving is organizing.
  4. Describe what you have and where you have it stored.
  5. Keep your archive in a safe place—high and dry.
  6. Remove the enemies.
  7. Protect your archive from mold, animals and bugs.
  8. Safely house your archives in suitable boxes, files, folders or tubes.
  9. Think about long-term access.
  10. Prevent obsolescence.
Hieronder zie je hoe tip 4 is uitgewerkt.
Het enige dat ik jammer vind, is dat verwijzingen naar meer gedetailleerdere bronnen ontbreken.

Gerelateerd
Zonder jurk niets om te doen opwaaien
Waarom digitale duurzaamheid belangrijk is voor jou
Preserving personal web content
Archive 2020

maandag 11 oktober 2010

Digitale houdbaarheid

Vorige week vroeg Marco de Niet van DEN om een andere term voor "digitale duurzaamheid"
  1. Marco de Niet
    marcodeniet Goede observatie durability is not the same as sustainability. Graag een andere NL term voor 'digitale duurzaamheid' #mc2010
-- this quote was brought to you by quoteurl

Nou hebben we de laatste jaren het gebruik van de term "digitale duurzaamheid" een beetje afgezworen en vervangen door "duurzame toegankelijkheid."
Maar, en daarin moet ik Marco gelijk geven, dit klinkt wel heel erg naar jargon.

  1. Marco de Niet
    marcodeniet @yhoitink Duurzame toegankelijkheid vind ik te veel vakjarbon. Als je het op een verjaardag laat vallen snapt niemand wat je ermee bedoelt.
-- this quote was brought to you by quoteurl

Mies Langelaar, van het Gemeentearchief Rotterdam en Chido (van zichzelf) deed een alternatief voorstel: digitale (onder)houdbaarheid.
Eigenlijk vind ik "digitale houdbaarheid" wel een mooie term. Mies schreef dat ze bij deze term wel altijd zocht naar het "datumstempeltje" en dat lijkt me ook juist het punt dat we willen maken: digitale bestanden zijn na verloop van tijd om verschillende redenen niet meer goed.
Ik ga de komende weken ook maar eens proberen of mensen deze term iets makkelijker snappen.

Plaatje: Thijs van Exel

vrijdag 10 september 2010

Lang zal hij leven

Vandaag wordt Max drie jaar, tijd om terug te kijken naar wat oude besturingssystemen...

David Rosenthal schrijft niet vaak op zijn blog, maar zijn bijdragen zijn meestal wel verfrissend. Een van zijn stokpaardjes is dat " the threat of software and format obsolescence is vastly over-blown."
Woensdag verwees hij naar een bericht op Technolizer.com over operating systems die maar niet willen sterven.
Wie kent ze niet: CP/M (1973), VMS (1977), MS-DOS (1981), Commodore Kernal/BASIC 2.0 (1982), AmigaOS (1985), OS/2 (1987) en EPOC (1989).
Allemaal achterhaald en ouderwets, maar ze worden allemaal blijkbaar nog gebruikt!

woensdag 8 september 2010

Home is where the harddrive is

Een paar weken (vlak voor mijn vakantie) werden op een site van de BBC een paar "hippe Amerikanen" geportretteerd die het merendeel van hun fysieke bezittingen vervangen door digitale objecten. Niet alleen cd's, en boeken, sommigen verkopen hun meubels of hele huis.
Een van die Amerikanen is Kelly Sutton, van Cult of Less, die probeert zo min mogelijk te bezitten. Hij wil uiteindelijk uitkomen op 2 tassen en 2 dozen. Maar Sutton heeft tenminste nog een huis, Chris Yurista en Joshua Klein en zijn vrouw hebben ook dat van de hand gedaan en leven nu 'op straat.' Yurista bezit niet meer dan "a backpack full of designer clothing, a laptop, an external hard drive, a small piano keyboard and a bicycle - an armful of goods that totals over $3,000 (£1,890) in value."
Mr Yurista feels by digitising his life, he no longer has to worry about dusting, organising and cleaning his possessions. And he says his new intangible goods can continue to live on indefinitely with little maintenance.
"Things like records snap and wear down over time. It's upsetting. MP3s don't," he said.
(...)
And Mr Yurista says he frequently worries he may lose his new digital life to a hard drive crash or downed server.
"You have to really make sure you have back-ups of your digital goods everywhere," he said.
En dan beschrijft de Beeb een tweede fenomeen dat ik niet kende: de data crisis counsellor:
Kelly Chessen, a 36-year-old former suicide hotline counsellor with a soothing voice and reassuring personality, is DriveSavers' official "data crisis counsellor".
Part-psychiatrist and part-tech enthusiast, Ms Chessen's role is to try to calm people down when they lose their digital possessions to failed drives.
Ms Chessen says some people have gone as far as to threaten suicide over their lost digital possessions and data.
We leven in een wonderlijke tijd...

Plaatje: Pedestrian Typography