vrijdag 5 maart 2010

Managing the crowd - Steve Bailey #archief20

Archiefbescheiden:
1°. bescheiden, ongeacht hun vorm, door de overheidsorganen ontvangen of opgemaakt en naar hun aard bestemd daaronder te berusten;
De meeste mensen waar ik tijdens mijn inspectiebezoeken mee praat, kennen deze definitie uit artikel 1 van de Archiefwet. Sommige slimmeriken voegen daar dan ook nog de slogan Archief is procesgebonden informatie aan toe. Maar bij al die organisaties worden de databasesystemen die gebruikt worden voor het beheren van begraafplaatsen, het verstrekken van uitkeringen en bouwvergunningen of het betalen van facturen niet als archief gezien. Steve Bailey (twitter - weblog) schrijft hierover in Managing the crowd. Rethinking Records Management for the Web 2.0 World:

"As the range, complexity and volume of information platforms have increased in recent years, so we have been able to continue with our traditional activities, safe in the knowledge that, interesting as they may be, they do not create records and are not, therefore, our responsibility. We have already discussed some examples of this in in terms of our professional response (or lack of) to the rise of the internet. To varying degrees, the same could be said about e-mail, instant messaging, research data, relational databases ans line of business applications and now, of course, Web 2.0. All of these examples do, in some shape or form, have the capacity to create records, but somehow this has largely gone unnoticed. Rather than trying to push our professional relevance to each of these new technical trends at every possible opportunity, we seem to have done our best to run the other way." (p.61)

In zijn boek probeert Bailey geen oplossingen te zoeken voor deze databasesystemen, zijn doel ligt nog hoger: hij probeert te schetsen hoe een archiefsysteem (in de breedste zin van het woord) voor het archiveren van Web 2.0-uitingen er uit zou kunnen zien.
Hij focust zich hierbij vooral op appraisal en classification: selectie & waardering en ordening & classificatie.

Uitgangspunt bij het klassieke klasseren en ordenen is wat Bailey "Central Command & Control" noemt. Op één plek worden alle archiefstukken beschreven, geordend, toegankelijk gemaakt en bewaard. Om dit te realiseren maken organisaties gebruik van een centraal ordeningsplan, een voor alles en iedereen geldend metadataschema en organisatie-overkoepelende afspraken. Het probleem is dat deze generieke instrumenten naar hun aard nooit specifiek genoeg kunnen zijn voor individuele medewerkers en taken en dat het nog al omslachtig is om ze aan te passen aan nieuwe omstandigheden.
In dit verband wijst Bailey ook op de paradoxale situatie dat mensen op hun werk ongeveer weigeren om metadata aan informatie toe te voegen, terwijl ze in hun vrije tijd voor hun plezier wel foto's in Flickr, filmpjes in Youtube en webpagina's in Delicious taggen. Waarschijnlijk, stelt Bailey, hebben mensen het idee dat ze met taggen hun individualiteit kunnen tonen, terwijl het metadataschema van de organisatie er juist op gericht is om alle individualiteit zo veel mogelijk uit te bannen.
Een derde probleem van "Central Command & Control" is dat het in de digitale wereld en in de Web 2.0 wereld in het bijzonder, zo goed als onmogelijk is om alle informatie op één centrale plek te bewaren. Een kenmerk van Web 2.0 is juist dat informatie wijdverspreid op het web staat (in een blog, in Google Docs, op een webforum). De vraag is dus hoe je al die informatie centraal zou kunnen klasseren en toegankelijk maken.

Baileys opmerkingen over selectie en waardering sluiten hier bij aan. Hoe kun je uit die enorme hoeveelheid data vaststellen wat een archiefstuk is en wat niet? En hoe ga je daarna bewaartermijnen vaststellen?
Ik dacht eerst dat hij zou zeggen dat selectie en vernietiging in een digitale wereld niet meer nodig is, maar hij hanteert voor de vernietiging van digitale archieven eigenlijk dezelfde argumenten als voor analoge: ruimtegebrek en kosten. Het lijkt hem onwaarschijnlijk dat de Wet van Moore tot het oneindige door zal gaan, op een gegeven moment is het gewoon onmogelijk om nog meer componenten op een kleiner oppervlak te monteren. Daarnaast verbruiken al die opgeslagen data natuurlijk ook heel veel stroom en de kans is groot dat we ook daar binnenkort tegen de natuurlijke grenzen aan lopen. En tenslotte is er (voorlopig nog) wetgeving die de verwijdering / vernietiging van sommige data verplicht stelt. Er moet dus wel geselecteerd worden, maar anders.

Op hoofdlijnen ben ik het met bovenstaande analyse van Bailey eens, maar ik heb hier en daar mijn twijfels bij de oplossingen die hij voordraagt. In het boek formuleert hij tien principes waar een archiefsysteem 2.0 aan zou moeten voldoen (vertaling van Paul Ruigrok):

  1. Schaalbaar tot (bijna) in het oneindige.

  2. Volledig, met de potentie om alle aspecten van informatiemanagement door de gehele lifecycle te adresseren.

  3. Onafhankelijk van specifieke hardware, software of fysieke locatie.

  4. Uitbreidbaar en in staat om snel nieuwe prioriteiten en verantwoordelijkheden op te nemen.

  5. Potentieel toepasbaar op alle vastgelegde informatie.

  6. Proportioneel, flexibel en toepasbaar op verschillende niveaus van kwaliteit en details.

  7. Een waardevolle ervaring voor gebruikers met een positieve incentive om deel te nemen.

  8. Verkoopbaar aan eindgebruikers, beslissers en belangengroepen.

  9. Zelfkritisch en positief ten opzichte van uitdagingen en veranderingen.

  10. Acceptabel voor en gedreven door de recordsmanagementgemeenschap en haar deelnemers.

En wat betekenen deze principers voor classificatie en selectie?
Bailey stelt dat de recordsmanager voor beide problemen gebruik kan maken van "the crowd". Voor classificatie zou dat betekenen dat er een soort 'corporate Delicious' zou komen, die mensen in staat stelt om alles wat ze in 'the cloud' plaatsen, toch op één 'centrale' plek kunnen taggen.
Voor selectie denkt hij aan het gebruiken van een soort User Voice-systeem waarbij gebruikers bijvoorbeeld kunnen aangeven of informatie voor hun interessant of relevant was en of deze (daarom) nog 12 maanden bewaard moet blijven.
Hoewel ik de logica achter deze voorstellen snap, voorzie ik één probleem en dat is schaalgrootte, of eigenlijk het gebrek daar aan.
Tags en systemen als User Voice werken optimaal als heel veel mensen actief mee doen. Pas dan worden de 'extremen' afgezwakt door de grote massa. Als vijfentachtig mensen zeggen dat iets een brommer is, tien zeggen fiets en vijf snorfiets, dan zal het wel een brommer zijn. Maar, als slechts vijf mensen een tag toevoegen en twee zeggen fiets, twee zeggen snorfiets en één zegt fiets, dan kun je op basis daarvan niet goed vaststellen welke van de drie het is. (Ik schreef hier al eerder over)
Maar in welke organisatie wordt één specifieke stukje informatie door meer dan vijf tot tien mensen 'behandeld' en dus getagd of gewaardeerd? Hoe effectief is een dergelijke oplossing dan?

Een ander punt waar ik toch moeite mee heb, is het loslaten van het onderscheid tussen 'record' en 'information'. Preciezer geformuleerd: het loslaten van de relatie tussen werkproces en archiefstuk en archiefstukken onderling. Bailey lijkt in het hele boek de relatie tussen archiefstuk en werkproces negeren. Hij gaat er niet van uit dat vanuit een werkproces bepaald wordt of informatie aan dat procesgebonden is of niet (en dus wel of geen archiefstuk is). In de plaats daarvan kiest hij voor het uitgangspunt dat alle vastgelegde informatie de potentie heeft om van belang te zijn en dus ook als zodanig behandeld moet worden. Voorlopig zie ik hiervan nog niet de voordelen in, maar misschien ben ik op dit punt te ouderwets en moet ik mijn Archiefschool-bril op dit punt bijstellen.

Overigens schreef James Lappin afgelopen week ook min of meer over dit onderscheid tussen "alle informatie" en een "dossier":

"[Organisarions] are not able to maintain good files across all areas of work. The concept of a file/records folder feels like an old-fashioned concept, a legacy from the hard-copy world of decades gone by. And yet organisations still need some means of relating together the records (however defined!) of a piece of work and managing them over time.
If the file/records folder was invented today, from scratch, with no history or legacy, what features would it have?"

Maken deze kritiekpunten op Managing the crowd het tot een slecht boek?
Nee, in tegendeel, Bailey maakt zelf van meet af aan duidelijk dat hij niet 'de' oplossingen heeft, maar dat hij vooral wil aanzetten tot nadenken:

"You may disagree with some of the solutions proposed in this book - perhaps even all of them - but if at the end of it you have been stirred into thinking of just one other approach that might be worth consideration it will have served its purpose."(p.XIX)

En om die reden alleen al, zouden alle archivarissen, recordsmanagers, DIV-ers of hoe ze zich allemaal noemen, dit boek moeten lezen. Want:


Deze blog werd mede mogelijk gemaakt door @janaca en @elchido

Geen opmerkingen:

Een reactie plaatsen