zaterdag 31 december 2011

Lijstjestijd: nog wat getallen over 2011

In het verloop van de bezoekersaantallen in 2011 zijn drie duidelijke pieken te zien:
11 januari: blijkbaar was de voornamenbank van het Meertensinstituut die dag weer in het nieuws, want op die dag zijn ongeveer honderd mensen op mijn blog gekomen met een zoekvariant op "hoeveel namen".
28 februari: het stukje over versies en archiefstukken had blijkbaar een redelijke impact, al zie je dit niet terug in de top tien.
19 oktober: Alexander weer...

Als ik de bezoekersaantallen tussen 2010 en 2011 vergelijk, dan blijkt dat deze bijna verdubbeld zijn:

2010
Bezoeken: ca 14.000
Unieke bezoekers: ca 8.800
Paginaweergaves: ca 22.500

2011
Bezoeken: ca 28.500
Unieke bezoekers: ca 17.600
Paginaweergaves: ca 43.000

Aantal berichten en reacties
In heel 2011 heb ik (inclusief dit bericht) 352 berichten gepost. Dat is dus toch bijna één per dag, ondanks drie weken zomervakantie en nu en dan een "rustdag".
En in totaal zijn er in 2011 845 reacties op berichten geplaatst, meer dan twee per bericht gemiddeld. Hieronder vind je de zeven berichten die de meeste reacties hebben uitgelokt:

Metadata in je plaatjes - 25 reacties
Laten we het nog eens over de WOB hebben - 15 reacties
Hoeveel tweeling-rijksambtenaren zijn er? - 15 reacties
Wat is het verschil? - 15 reacties
Mooiste TV uit Duitsland en België - 14 reacties
Archiefstukken in MoReq2010 - 14 reacties
Waarom zou ik een RMA gebruiken? - 14 reacties

Geen van deze zeven staat in de top tien van meest bezocht berichten! (En de eerste en de derde staan wel in mijn persoonlijke top tien.)

Bezoekers
Nog twee dingen over de bezoekers.
Volgens Analytics is ongeveer 60% van de bezoekers "nieuw" en dus 40% "returning", waarbij de gemiddelde tijd op de site 1 minuut en 22 seconden is.
Van de bezoekers komt ongeveer 45% binnen via een zoekopdracht op Google, 22% via een link op Twitter en bijna 8% via de rss-feed. Vooral dat grote percentage dat via twitter binnen komt, verbaasd me een beetje (Hoewel, daar zit Alexander ook weer bij...)

vrijdag 30 december 2011

Lijstjestijd: De tien beste berichten uit 2011 (volgens mij dan)

In chronologische volgorde, de berichten van afgelopen jaar die ik het best geslaagd vind.

7 januari: Infopocalypse, kent u dat?
Naar aanleiding van een artikel over de enorme hoeveelheid data die we met zijn allen creëren en de vraag hoe we dat toegankelijk en begrijpelijk houden. Mijn uitgangspunt: je kunt niet zonder menselijke interpretatie.

22 februari: Digitale departementen, e-depot en achterstanden
Ik heb het afgelopen jaar verschillende keren geprobeerd om de acties en persberichten van het Nationaal Archief te "deconstrueren." Dit bericht gaat, net als dit, onder andere over het magische begrip achterstand. Blijkbaar krijg je op rijksniveau meer voor elkaar als je zegt dat je achterstallig werk doet, dan wanneer je "gewoon" werk dit.
Ook bij dit persbericht van het NA is in feite sprake van het 'wegpoetsen' van een overbrengingsachterstand.

19 maart: Macht, archiefvorming en archieven
Naar aanleiding van een Amerikaans onderzoek naar het gebruik en de toegankelijkheid van de archieven van de 9/11-commission. Machtspolitiek in het groot, met archieven als wapen en strijdtoneel tegelijkertijd.

1 juli: Daar is hij dan: de #archiefvisie & Wat ik echt mis in de #archiefvisie
Twee berichten op een dag, die eigenlijk ook bij elkaar horen. Ik ben het nog altijd eens met mijn analyse van de Archiefvisie en mis ook nog altijd de "definitie" van wat archief is. Dat bleek onder andere ook tijden discussies later dit jaar over de Baseline Gemeentelijke Informatiehuishouding.
Wat mijn nu ook opviel: in januari schreef ik over de nieuwe selectie-aanpak, naar aanleiding van een brief van de staatssecretaris aan de Tweede Kamer. In die brief stond onder andere:
De adviserende rol die de Raad voor Cultuur speelt bij de beoordeling van de individuele selectielijst maakt plaats voor systeemtoezicht waarbij achteraf wordt getoetst of het proces van waardering en selectie conform de gestelde regels en uitgangspunten is uitgevoerd. In het voorjaar van 2011 informeer ik u via de archiefvisie waar dit systeemtoezicht wordt belegd.
Misschien heb ik erover heen gelezen, maar ik ben hierover niets meer in de Archiefvisie tegen gekomen...

29 augustus: Vrijheid van meningsuiting of zelfcensuur
Mijn verantwoording van wat ik wel en niet schrijf op dit weblog. Naar aanleiding van een scriptie die ik nog altijd niet helemaal gelezen heb. Bij het bladeren door de oude berichten viel me op dat er ook een link ligt met Een dunne lijn van begin deze maand.

30 augustus: Hoeveel tweeling-rijksambtenaren zijn er?
Eigenlijk een uit de hand gelopen grapje naar aanleiding van een vreemde zaak over het gebruik van het BSN: kun je uitrekenen hoeveel rijkambtenaren dezelfde achternaam, voorletters en geboortedatum hebben?
Ik geloof dat het antwoord "nee" is, maar heb wel me er wel mee geamuseerd.

9 september: Driehoeken, vernietiging en de archivaris
Ik heb dit jaar verschillende berichten geschreven naar aanleiding van archiefkwesties in de Nederlandse politiek en media. Dit bericht ging over het (onrechtmatig) vernietigen van verslagen van het Utrechtse driehoeksoverleg. Een ander bericht ging over een pdf-bestand dat verdwenen was in een e-mailsyteem en waarvan heel Nederland deed alsof het een schietpartij had kunnen voorkomen.

21 september: Gezichten in archieven
Als post niet zo indrukwekkend, maar ik ben wel heel erg onder de indruk van het project dat ik in het bericht beschrijf.

19 oktober: E-mails vinden: opportunistisch of voorbereid
Naar aanleiding van een onderzoek over de manier waarop mensen hun mailbox beheren en wat dit betekent voor het "echte" archiveren.
(Ik heb deze week ook Much ado about e-mail weer eens herlezen, omdat begin deze maand die meneer van Atos zijn luchtballon nog maar een keer opliet...)

15 november: Metadata in je plaatjes
Eigenlijk zo voor de hand liggend: stop de metadata in de plaatjes die je op internet publiceert, zodat mensen altijd kunnen achterhalen wat ze zien en waar ze het kunnen 'halen'. Ben heel benieuwd naar de ervaringen van het Historisch Centrum Overijssel.

Gerelateerd
Lijstjestijd: mijn beste berichten van 2010 (volgens mij dan)

Plaatje: straattekening van Juandres Vera

donderdag 29 december 2011

Lijstjestijd: De tien meest bezochte berichten van 2011

Net als vorig jaar, eindig ik mijn blogjaar met wat overzichten. Gisteren wat ik gelezen heb in 2011, morgen de tien berichten die ik het beste vond en vandaag de tien meest bezochte berichten van afgelopen jaar. Overmorgen nog wat losse opmerkingen over bezoekersaantallen en wat statistiekjes.

De vier berichten die in 2011 het meest bezocht werden, dateren uit 2009 en 2010 (en tellen niet mee in deze top tien):
3 juni 2010 - Voornamenbank: hoeveel naamgenoten heb jij?
30 juli 2009 - Sclera pictogrammen
6 december 2010 - Kwaliteitscontrole, steekproeven en dan?
2 oktober 2010 -  Gelezen: Marente de Moor - De Nederlandse maagd

1. E-mail van de KB #WOB
Een van de berichten uit de KB-Google-serie. De reden waarom deze bovenaan staat is overduidelijk: Alexander Klöpping. (Zie ook nummer 6 hier beneden.)

2. Wat moet een archivaris kunnen?
De start van een blogkermis, die eigenlijk nog altijd moet afronden. Doe ik waarschijnlijk nog wel in 2012, al heb ik ontdekt dat ik niet zo'n goede kermis-exploitant ben.

3. De Archiefwet wordt gewijzigd
Omdat de eigenlijke nummer zeven uit 2010 dateert, sla ik die weer over en kom dan uit bij mijn eerste bericht over de voorgenomen wijzigingen in de Archiefwet. En helaas bleek vlak voor de Kerst dat het nog niet afgelopen is met het hap-snap-wijzigen van de Archiefwet en het hele "archiefbestel".

4. Het einde van de provinciale archiefinspectie?
Bericht over de wijzigingen in het interbestuurlijk toezicht zoals die waarschijnlijk in 2012 zullen ingaan. Beetje "down" stukje, omdat ik het echt jammer vind dat de provinciale archiefinspectie op deze manier wordt opgedoekt en uitgekleed.

5. Doc-Direkt en de magische achterstanden
Een van mijn pogingen om de ambtelijke woordengoochelarij van de ministeries van OCW en BZK te ontmaskeren.

6. Een tweede WOB-verzoek voor de KB
En dit verzoek is nog niet afgehandeld. Ik heb wel antwoord gekregen, maar daar ondertussen ook weer bezwaar tegen aangetekend. Wordt vervolgd.

7. Gelezen: Tonio van A.F.Th. van der Heijden
Dit bericht leverde een wonderlijk commentaar op van de broer van de schrijver. Dat leverde de maandag na publicatie een bezoekerspiek op. Daarna komen heel wat bezoekers via Google binnen.

8. Het bewaren van overheidswebsites
Mijn beknopte biografie van website-archivering, als reactie op enkele discussies op BREED en naar aanleiding van reacties op dit bericht. En ik blijf volledig achter de laatste zin van dit artikel staan.

9. Wat doen we met de vervanging?
Bericht waarin in zinspeel op iets wat toen officieel nog niet bekend was: het schrappen van de machtiging voor de vervanging van permanent te bewaren archiefbescheiden uit de Archiefwet. Vervanging (of substitutie) doet het altijd goed voor de bezoekersaantallen. Iedereen vindt het maar ingewikkeld en gebruikt Google om een oplossing te vinden.

10. Gelezen: Jonathan Safran Foer - Tree of codes
En nog een bericht over een boek dat ik gelezen heb, dat veel bezoekers trekt. Hoewel, eigenlijk heb ik het boek maar gedeeltelijk gelezen. Het idee en de vormgeving was interessanter dan het resultaat.

Gerelateerd
Lijstjestijd: de tien meest bezochte berichten van 2010

Plaatje: hinkelen/Himmel+Hölle/hopscotch van tdietmut

woensdag 28 december 2011

Lijstjestijd: Wat Ingmar in 2011 las

Maia Cummins - Library
Dit jaar wat minder boeken gelezen dan vorig jaar en er acht  negen beoordeeld met vijf sterren. Van die acht negen maakten HhhH, We need to talk about Kevin, en Provenance de meeste indruk op me.

Gerelateerd
Lijstjestijd: Wat Ingmar las in 2010
Lijstjestijd: Wat Ingmar in 2009 las

vrijdag 23 december 2011

De kamer van Leopold: wie herkent de partituur?

De foto hierboven dateert uit 1906 en de werkkamer van de dichter J.H. Leopold staat er op afgebeeld. Mijn oude hoogleraar Dick van Halsema kwam de foto tegen in "een nogal ongeordende verzameling papieren over van alles met, in en rond" de familie Leopold. Veel had nauwelijks met de dichter te maken, maar over deze foto schrijft Dick op de website die Tirade speciaal aan deze foto heeft gewijd:
Toen ik hem voor het eerst zag (achterop stond al dat het de werkkamer van de dichter was) was dat de historische sensatie in optima forma. Het is de legendarische kamer in Rotterdam waar Leopold bijna dertig jaar heeft gewoond (al zijn er bij de vaststelling van de woonplek of -plekken van Leopold in Rotterdam een paar complicaties, zie elders in dit nummer) en waarvan we, anders dan bij andere grote schrijvers uit Leopolds tijd, geen voorstelling hadden omdat er geen afbeelding van bekend was. Ik denk dat Leopold de foto zelf gemaakt heeft (vandaar ook de lege stoel) en dat er een argument is om hem te dateren op 1906.
Verschillende auteurs hebben artikelen geschreven over de kamer en enkele objecten op de foto, maar er is ook een 'crowd sourcings vraag' aan gekoppeld:
Er staat van alles op de foto dat nog niet is opgehelderd. De muziek op de piano is volgens een kenner niet van Beethoven. Van wie wel? Het is de bedoeling dat de foto zijn vragen door blijft stellen op deze website. Interactieve hermeneutiek. Als dat begrip nog niet is uitgevonden, doen we het hierbij cadeau aan de wereld.
Op de website staat een foto van 4003 x 3699 pixels zodat je alle details kunt bekijken. Dus als je de partituur herkent of weet welke stèle links hangt, laat je Dick dat dan even weten?

donderdag 22 december 2011

Federal Scanning Commission, ook in Nederland?

We are not necessarily suggesting that the federal government immediately undertake an ambitious effort to scan the holdings of .gov, but if we ever hope to begin even a small piece of making available our past for use by our future, we should at least begin to scope out the size of the problem. We believe it would require a decade-long commitment to digitization to make our nation's cultural, scientific, educational, and historical resources available, but we can't even begin that discussion unless we know how big the problem is. Such an effort is indeed ambitious to contemplate, but we can only ask if we were able to put a man on the moon, why can't we launch the Library of Congress into cyberspace?
Nieuws van Karl Malamud, de man die de International Amateur Scanning League oprichtte. Hij pleit voor een "Federal Scanning Commission" die binnen een jaar de volgende vragen moet beantwoorden:
  1. What are the holdings of our national institutions? How many images, documents, videos, and other objects are there?
  2. How long would it take to digitize these materials?
  3. How much would it cost given current technology? Is there directed research or are there economies of scale that would bring those costs down?
  4. What is the strategy for digital preservation of these materials? How will we avoid digital obsolescence?
  5. What is the strategy for identifying restrictions on use of the material? How does one identify and safeguard materials that have copyright restrictions, contain personally identifiable information, or contain classified materials?
  6. What are the economic and non-economic benefits of such an effort?
    • What are the cost savings to government?
    • What are the economic benefits? Would this effort industries that build on top of scientific and technical information, spur innovation in the legal marketplace, or enable our creative industries to create more effectively?
    • What are the non-economic benefits? Will such an effort lead to better STEM and other educational efforts? Will it promote a more informed citizenry and better access to justice?
Kijk, dat zijn de betere ambities: binnen een jaar antwoorden op de meest cruciale vragen om binnen tien jaar alles gedigitaliseerd te hebben.

En weet je, dit past redelijk binnen de Archiefvisie van de staatssecretaris.
Wat als we een deel van die innovatiegelden nou eens aan een vergelijkbaar onderzoek besteden?

Gerelateerd
Amateur scanners aller landen verenigt u
Daar is hij dan, de #archiefvisie

Plaatje: Rogue Archivist van Justgrimes

woensdag 21 december 2011

Bellen met de doden

Bellen met de doden
Geen commentaar, alleen citaten:
In an added twist, Jacobs was buried with his cell phone fully charged. Mourners were startled when the first post-mortem call arrived during the burial service. Jacob’s wife, Marian Seltzer, even had Jacobs’ headstone engraved with his phone number. Family and friends continue to leave voice messages for Jacobs, taking comfort in this facsimile of his presence.
Fox News reported about Charles Whlting of Irvington, NY, who kept his wife’s voicemail active since 2005. Whlting, 80, kept the account active so that he could listen to Catherine Whlting’s voice on the outgoing message. In 2008, a change in the voicemail system brought this story to light, as Whlting thought the recording was lost. Whlting blamed Verizon saying, “Now they took her voice away.” Luckily a Verizon contractor was able to locate an archived copy of the recording and restored Catherine Whlting’s voice to the system.
For a dose of the paranormal, a UK-man believes that he’s receiving text messages from his deceased wife, who, like Jacobs, was buried with her mobile telephone. “She always had a mobile with her,” Jacobs told The Register. ” We buried her with her phone. There have been messages with words Sadie would say but there’s no number.”

dinsdag 20 december 2011

Zwart-wit, zwart-geel en het Koninkrijk

Wiehad MeinKampf gelezen?
Erwarener- maarhunbeoordelingen warenveelalopvallend waarderend.
In het weekblad van ds.Geelkerken's HersteldVerband, Woord en Geest,
wasin dezomer van 1932 een reeks van zeven lange artikelen verschenen,
gewijd aan het nationaal-socialisme. Hiders antisemitisme was er bij de
schrijver alskoekingegaan, ookin Nederlandhadden, schreefhij, 'de Joodse
marxisten... het volk geïnfecteerd metdematerialistischebacil die nauw
verwant is aan de veroorzaker van hun eigen ziekte, de bekende Joodse,
materialistische mammondicnst'"; het nationaal-socialisme was prijzens-waardig: 'de uiting van een
te lang gemarteld volk, van eenvolk dat door
eenzijdige, onoordeelkundig opgelegde vredesverdragen tot het uiterst van
zijn spankracht is gefolterd'"; welhad de schrijver hier en daar bezwaren
tegen dementaliteit die uit Mein Kampf sprak, maarmenmoestbedenken
datHitler,toen hijditwerkschreef, 'aan eenverbitterde gemoedsstemming
ten prooi was';sindsdien had hijzich 'meer vredelievend betoond", Enkele
maandenlater deed dr. J. A.Nederbragt in het maandblad van de Anti-Revolutionaire Partij,
Anti-Revolutionaire Staatkunde, onder detitel 'Hitler,
Nog even terugkomen op de digitalisering van Het Koninkrijk der Nederlanden in de Tweede Wereldoorlog door het NIOD. Ondertussen zijn de technische problemen opgelost: het NIOD heeft de bestanden op twee servers gezet: http://lou.niod.knaw.nl/ en http://niod.hosting-concepts.nl/. Dat is mooi.
Nog mooier is dat je een zip-bestand met alle pdf's in kleur (1,24 GB) via een torrent op Mininova  kunt downloaden. Dat zouden er meer moeten doen.

Rest nog één andere vraag:
Waarom heeft het NIOD gekozen voor scannen in kleur en in zwart-wit?

Hierboven zie je van boven naar beneden een deel van pagina 167 uit deel 1 in kleur en in zwart-wit. Daaronder staat de OCR-tekst van dezelfde passage.
Het bestand in kleur is ongeveer een derde groter dan het zwart-wit bestand (85 MB vs 64 MB).
Maar, wat is de meerwaarde van de gele pagina's?
Er is een fysieke verklaring voor te geven. Het is de "wetenschappelijke" uitgave van Het Koninkrijk die door het NIOD gedigitaliseerd is en die blijkt te zijn gedrukt op wat dikker, licht geel papier. Voor de publieksuitgave was daarentegen gewoon wit papier gebruikt.
Onder archivarissen is er een oneindige discussie over scannen in kleur of zwart-wit als het gaat om de vervanging van archiefstukken. Mijn standpunt is - zoals waarschijnlijk bekend - dat kleur alleen nodig is als het iets betekent. Onder bibliothecarissen is er volgens mij zo'n zelfde discussie, waarbij de bibliothecarissen het "boek zijn" van een boek benadrukken, terwijl er ook mensen zijn die vooral het "informatieve" van de inhoud benadrukken.
Als je nu naar Het Koninkrijk kijkt, dan lijkt me geen enkele reden te verzinnen om een kleurenreproductie te maken. De gekleurde stofomslagen zijn niet meegescand en alle (in het origineel zwart-wit) plaatjes zijn verwijderd in verband met auteursrechten. Het is ook geen "persoonlijk" exemplaar dat gedigitaliseerd is. Je zou je nog kunnen voorstellen dat aantekeningen die deze of gene gemaakt heeft, digitalisering in kleur noodzakelijk maken. Dus waarom die extra moeite?

En dan kom ik toch weer terug op waar ik vorige week op hintte: de (her)bruikbaarheid van de reproducties.
Het NIOD schrijft zelf:
Gebruikers met een Mac kunnen het bestand beter eerst opslaan en vervolgens met Adobe Acrobat Reader openen. Openen in Safari levert een slecht leesbaar resultaat op.
Waarom dan geen moeite gedaan om de teksten ook nog in een ander exemplaar aan te bieden? The Internet Archive doet dat bijvoorbeeld standaard.
Of waarom niet nog meer tijd besteed aan adequate OCR?
In het voorbeeld hierboven zie je dat de letterherkenning redelijk is: er komt geen foute letter in voor. Wat je echter ook ziet is dat de spatiëring te wensen over laat. Dit heeft bijvoorbeeld tot gevolg dat een zoekactie op "Mein Kampf" in deel 1 negen treffers oplevert, terwijl "MeinKampf" er elf oplevert. Maar dat zijn ze nog niet allemaal, want "MeinKampj" komt ook nog minstens één keer voor (op p. 152).

Ik kan lastig inschatten wat de extra kosten voor de digitale reproducties in kleur zijn geweest, maar totdat iemand me kan uitleggen waarom kleur noodzakelijk was, vind ik het jammer dat die euro's niet aan andere formaten of een betere OCR besteed zijn.

Gerelateerd
Het Koninkrijk, het Journaal en de techniek

maandag 19 december 2011

DLMConference #dlm2011

Wat ik gehoord, gezien en geleerd heb tijdens drie dagen in Brussel... Een selectie tweets en aantekeningen. Uitgebreidere verslagen kun je lezen bij Jorien en Ruud.
https://twitter.com/#!/Ingmario/status/146214697073512449
De papieren versie is de defintieve 1.1 versie van MoReq2010, die hier straks ook, samen met een XML-export-schema en een beta-test en cerificeringsprogramma beschikbaar is.
Tijdens een van de sessies was er nog discussie over de verschillen tussen MoReq2010 en de ICA-Requirements en of er eisen voor "long term preservation" in zijn opgenomen:

Web 2.0
Een paar keer kwamen social media en web 2.0 aan de orde. Maar het teleurstellende was dat het inhoudelijk niet veel voorstelde.
Iemand van FEDICT zei:
"We have to think about other media. Not only archiving "documents", but also what was published about the document in social media."
Maar Richard Jeffrey-Cook zei een dag later over het bewaren van tweets: "You could print them and store them as pdf."
En daarnaast werd ook maar weer eens de discussie gevoerd worden over "central control" en of de uitingen wel als archiefstukken "bedoeld" waren. Alsof intentie relevant is...
Gelukkig zette Eric Ketelaar dit op de laatste dag recht door te benadrukken dat "the records of the conference can be found on twitter with #dlm2011."
http://twitter.com/Ingmario/status/146907242489315328

Privacy
Een paar keer kwamen privacy-aspecten aan de orde. Julie Mcleod had aan enkele collega's gevraagd om het "motto" van het congres Making intelligent information control a reality in Europe volgens hun betekende. En dat leverde onder andere de volgende antwoorden:
"The phrase means nothing to me..."
"Frightening. Control smacks of power relationships. Hopefully 'access' was meant... The fact that systems interoperate so poorly is probably quite beneficial to our privacy..."
Op de laatste dag kwamen privacy en data protection (wat twee heel verschillende dingen zijn) uitgebreid aan de orde, toen Peter Hustinx van EDPS de plannen van de Europese commissie kwam uitleggen.
Hustinx besprak ook even het "Right to be forgotten" dat eurocommissaris Reding wil regelen. Toen iemand uit de zaal hem vroeg of dit recht niet strijdig was met het "historisch" belang van archieven, beaamde hij dit. Hij benadrukte dat de eurocommissaris het begrip vooral "voor de media" hanteert.
Tijdens dit antwoord moest ik denken aan 9 Reasons Why a ‘Right to be Forgotten’ is Really Wrong van Joris van Hoboken. Hij schrijft onder andere:
2. A right to be forgotten actually doesn’t exist. The existing right to erasure was never absolute in the first place. It is merely the expression of the general principle of purpose limitation that underlies many of the data protection rules. If a company of government agency processes personal data about you, it needs a legitimate reason to do that. If they no longer have that reason it follows they need to stop processing the data and the ‘right to erasure’ gives you a specific legal provision to ask them to do so. To call this a right is an overstatement and gives the wrong impression to those that want information deleted as well as those that would like to keep it public.
Sharepoint en Denemarken
In totaal zag ik zeven "break-out-sessions" en twee daarvan waren de moeite waard om hier te memoreren.
Allereerst James Lappin van Thinking Records over Sharepoint, EDRMS en business applications. Hij vertelde weinig nieuws (Sharepoint is not a records management solution) maar het was verstaanbaar, begrijpelijk en onderhoudend en hij had de origineelste sheet, zoals deze:
Een andere interessante lezing was van Jan Dalsten van het Nationaal Archief van Denemarken.
In Denemarken moeten archiefblokken na vijf jaar afgesloten en binnen zes maanden overgebracht worden naar het archief. Sinds 1996 accepteert het archief "fully digital RM-systems", waarbij de zorgdrager moet zorgen voor systeem-onafhankelijke sips, waarbij maar enkele formaten zijn toegestaan (vreemd genoeg geen pdf/a, wel Tiff). Daarbij moeten ook ALLE tabellen uit de RM-applicaties in het (aangepast) SIARD-formaat worden meegeleverd. Wat de benodigde metadata betreft, is het uitgangspunt van het archief dat de diensten de metadata moeten gebruiken die zij nodig hebben, "not the metadata the National Archives can think of..."
Tenslotte vindt er op dit moment nauwelijks selectie en vernietiging plaats: "Lesser need for appraisal - the cost of appraisal should not exceed the benefits of it." Nu wordt op systeem- / applicatieniveau bewaard, straks worden larger groups alleen verwijderd als verwijderen goedkoper is dan bewaren.
Grote vraag is - en die wil ik hem nog stellen, dat is in de wandelgangen niet gelukt - hoe bereken je wat "eeuwige bewaring" kost?

Gerelateerd
Europees recht op vergeten worden
Archiefstukken in MoReq 2010
RMA, SOA en MoReq 2010
Gebeurtenissen in MoReq 2010
Import/export en vernietiging in MoReq 2010

zaterdag 17 december 2011

Gelezen: N. van der Sijs - Dialectatlas van het Nederlands

Nu en dan moest ik terugdenken aan het minst leuke vak dat ik aan de Vu moest volgen: Historische Taalkunde van Arjan van Leuvestein. Vreselijke taal-stambomen, woordstammen en niet-bestaande woorden die bewezen dat alle talen terug gingen op het Indo-Europees. Maar dat was maar sporadisch, want het grootste deel van dit boek bestaat uit heel amusante en interessante toelichtingen bij kaarten zoals ik ze hier een paar weken geleden al liet zien.
In zeven hoofdstukken bespreken Van der Sijs cs de geschiedenis van het dialectonderzoek, de Nederlandse taal, de verspreiding van woorden, klanken, woordvormen, zinnen en namen in de Nederlandse (inclusief Vlaamse) dialecten. Dat laatste hoofdstuk over namen, vond ik niet zo interessant, maar de andere vijf heb ik met veel plezier gelezen (en in de marge becommentarieerd).
Bijvoorbeeld als Jan Stroop heel stellig schrijft dat het woord (n)onkel voor oom alleen in Vlaanderen gebruikt wordt, en nergens in Nederland. Maar rond Maastricht zeggen we toch ook noonk.
Heel interessant vind ik het verschijnsel valtoon en sleeptoon dat alleen in de Limburgse dialecten gebruikt wordt. In het Maastrichts heeft het woord broet twee betekenissen. Als je het kort  - valtoon - zegt (broet) betekent het brood, als je het lang - sleeptoon - zegt (broeoeoet) betekent het bruid. Of, nog aparter: beiein betekent been en bein betekent benen.
Verder kwam ik allerlei formuleringen tegen die ik (onbewust en soms bewust) heb afgeleerd toen ik in Amsterdam ging wonen, zoals het gebruik van zich in zinnen als: Hij drinkt zich een biertje.
Toch jammer dat we aan dit dialectonderzoek bij Nederlandse Taal- en letterkunde aan de VU nauwelijks aandacht besteed hebben.

Gerelateerd
Spiekerboks en appelsien
Kal toch plat!

vrijdag 16 december 2011

Volg-me-niet niet-goed-genoeg

Kijk aan, de Europese privacy-toezichthouders stellen na drie maanden ook vast dat het "Volg-me-niet-register" niet voldoet aan de Europese privacyrichtlijn.
Arnoud Engelfriet schrijft erover:
De marketingbranche heeft een alternatief ontwikkeld, en wel het icoon rechtsboven. Dit komt dan op of bij een advertentieblokje te staan. Wie zo’n advertentie ziet, kan op het icoon klikken en gaat dan naar Your Online Choices, waar hij kan zien welke cookies er al bezig zijn hem te tracken en welke firma’s dat allemaal (willen) doen. Tevens kan daar dan een einde aan worden gemaakt.
Volgens de privacytoezichthouders is dit echter absoluut onvoldoende. Ten eerste snapt op dit moment niemand wat dat icoon betekent, dus je wordt niet (zoals wettelijk vereist) adequaat geïnformeerd over wat er allemaal gebeurt. Ten tweede wordt alleen gesproken van “advertenties” terwijl er eigenlijk “gepersonaliseerde advertenties” zou moeten staan.
Maar, het allerbelangrijkste: zo’n icoon is natuurlijk een opt-out terwijl de wet een opt-in eist. Je bent al gedragsmatig geprofileerd tegen de tijd dat je dat icoon ziet, en daar heb je op dat moment nog geen toestemming voor gegeven.
Gerelateerd
Volg me niet

donderdag 15 december 2011

Embedded Metadata Manifesto

Even terugkomen op een bericht van een paar weken geleden...
"Embedded Metadata Manifesto":
  1. Metadata is essential to describe, identify and track digital media and should be applied to all media items which are exchanged as files or by other means such as data streams.
  2. Media file formats should provide the means to embed metadata in ways that can be read and handled by different software systems.
  3. Metadata fields, their semantics (including labels on the user interface) and values, should not be changed across metadata formats.
  4. Copyright management information metadata must never be removed from the files.
  5. Other metadata should only be removed from files by agreement with their copyright holders.
Lees meer op http://www.embeddedmetadata.org en sla dan vooral de use cases niet over.

Het manifest is trouwens een initiatief van verschillende organisaties onder andereWAN-ifra, Pyramide Europe, CEPIC en BVPA

Gerelateerd
Metadata in je plaatjes

maandag 12 december 2011

Het Koninkrijk, het Journaal en de techniek

Gisteren verscheen om 16:35 uur op de NOS-site het bericht Standaardwerk Loe de Jong te downloaden.
Het NIOD heeft alle delen van Het Koninkrijk der Nederlanden in de Tweede Wereldoorlog gescand en online gezet. Een paar minuten voor vijf twitterde ik:
https://twitter.com/#!/Ingmario/status/145894940403183617
Daarna liet David Barnouw weten dat "Het Koninkrijk" vanaf  20.00 uur te downloaden was:
https://twitter.com/#!/barnouwwar/status/145898089562116096
Ik heb rond een uur of zes geprobeerd een van de pdf-bestanden te downloaden, maar heb dat uiteindelijk afgebroken. Het ging nogal langzaam. (En dan ga ik het hier niet eens hebben over de bruikbaarheid van 29 pdf-bestanden die ieder groter zijn dan 40 MB...)
Ondertussen vreesde ik een item in het NOS Journaal van acht uur:
https://twitter.com/#!/Ingmario/status/145920985323945985
En ja hoor, twintig minuten na acht uur twitterde het NIOD heel trots:
https://twitter.com/#!/NIODamsterdam/status/145946155057020928
Maar helaas, de website kon de grote toeloop niet aan, vanmorgen stond op de downloadpagina:

Door het grote aantal downloadverzoeken zijn er technische problemen. We werken aan een oplossing

Eerlijk gezegd vind ik dit zo ontzettend knullig...

Zondagavond, 
acht uur, 
iedereen (normaal ruim 2,5 miljoen mensen) kijkt met laptop of tablet op schoot,
gratis download, 
Tweede Wereldoorlog... 

Wat denk je dat die mensen doen? 
Wat wil je dat die mensen doen?
En wat kunnen die mensen uiteindelijk niet doen?
Zo jammer...

vrijdag 9 december 2011

Uitlenen van overgebrachte archiefbescheiden

Wetten en statuten
van de Universiteit Leiden, 1631,
uit het Archief van Curatoren
(AC1 1)
Een week of twee geleden, berichtten het Nationaal Archief en de Universiteit Leiden alletwee over de overbrenging van de universiteitsarchieven naar het Nationaal Archief. Zo'n overbrenging is normaal gesproken geen nieuws, maar deze keer is er geen verhuisbedrijf aan te pas gekomen. In de woorden van de Universiteit:
Paul van der Heijden, rector en voorzitter van het College van Bestuur van de Universiteit Leiden en Martin Berendse, Algemeen Rijksarchivaris, hebben een overeenkomst gesloten waarbij de Leidse universiteitsarchieven in formele zin zijn ‘overgebracht’ naar het Nationaal Archief. Tegelijkertijd heeft de Algemeen Rijksarchivaris het besluit ondertekend om deze archieven in langdurige bruikleen te geven aan de Universiteit Leiden. Dit alles zonder dat er ook maar één snipper papier is verplaatst.
Het Nationaal Archief voegde daar in zijn bericht nog aan toe:
De formele regeling die nu is getroffen, houdt in dat het universiteitsarchief overeenkomstig de Archiefwet wordt overgedragen aan het Nationaal Archief, maar direct weer wordt uitgeleend. De universiteitsbibliotheek voldoet aan de voorwaarden die aan archiefbewaarplaatsen worden gesteld. Tot nu toe is deze regeling in een zeer beperkt aantal gevallen toegepast, namelijk voor het NIOD, het Rijksmuseum en de Hoge Raad van Adel.
En ik vroeg me af: Kan dat nu zomaar?
Wat rondzoeken en het inschakelen van een hulplijn leverde het volgende op:
Ja het mag, maar er zijn wat haken en ogen.

Op grond van het tweede lid van artikel 18 van de Archiefwet, is de beheerder van de archiefbewaarplaats bevoegd "archiefbescheiden voor een bepaalde tijd uit te lenen aan een instelling, mits een deskundig beheer en een veilige bewaring zijn gewaarborgd. Aan een zodanige uitlening kunnen voorwaarden worden verbonden."

Wat hier meteen al opvalt is dat uitlening slechts voor "bepaalde tijd" toegestaan is. De universiteit en het NA noemen in hun berichten geen concrete termijn, de Universiteit spreekt van "langdurige bruikleen".
Maar er is meer...

In 1996 heeft de toenmalige algemene rijksarchivaris een circulaire over uitlening geschreven: Richtlijnen voor de uitlening van archiefbescheiden. De circulaire heb ik nog nergens online gevonden, maar hij staat in ieder geval in het Handboek Archiefrecht en in "Schuurmans & Joordens".
Er staan interessante dingen in die circulaire:
2. [...] Maar om te voorkomen dat iedere keer opnieuw een beheerder van een archiefbewaarplaats zelf onderzoek moet laten instellen of een aanvragende instelling een deskundig beheer en een veilige bewaring waarborgt, hebben rijksarchiefdienst, Landelijk Overleg van Provinciale Inspecteurs en Kring van  Archivarissen bij Lagere Overheden besloten een lijst te maken en bij te houden van instellingen waar een dergelijke toetsing niet of niet meer nodig is.
Deze lijst wordt aangehouden door de algemene rijksarchivaris en de provinciale inspecteurs der archieven. De algemene rijksarchivaris zorgt voor regel-matige publikatie van de lijst.
3. Op de lijst worden in ieder geval geplaatst: het Koninklijk Huisarchief, alle rijksarchiefbewaarplaatsen, alle archiefbewaarplaatsen van gemeenten en waterschappen, mits daaraan een archiefambtenaar in het bezit van het diploma archivistiek is verbonden, de bewaarplaats door GS is goedgekeurd en raadpleging in een studiezaal onder voortdurend toezicht is gewaarborgd.
Ik heb gezocht naar een dergelijke lijst, maar heb hem nog niet gevonden. Als iemand hem heeft, hou ik me aanbevolen.

Als een instelling niet op de lijst staat, kan er toch uitgeleend worden, maar dan dient de beheerder zich ervan te vergewissen dat: de archiefbewaarplaats voldoet aan de eisen, er deskundig personeel belast is met het beheer van de bewaarplaats, de raadpleging in de studiezaal veilig kan gebeuren.
In dit geval is het rapport van de Erfgoedinspectie uit 2009 misschien nog wel interessant.

Wat zeker interessant is:
4. Ieder verzoek om uitlening vergt een besluit van de beheerder van de archiefbewaarplaats, die bevoegd is het verzoek af te wijzen (artikel 18, derde lid), met de mogelijkheid van beroep ingevolge de Algemene wet bestuursrecht.
Behalve de hierboven geciteerde persberichten, heb ik nog geen besluit van de Algemene Rijksarchivaris gezien / gevonden. Ook hiervoor houd ik me aanbevolen.

En wat dacht je van lid 5:
Het verdient aanbeveling om, in geval van een verzoek tot uitlening aan een instelling gelegen binnen een afstand van 50 km of van een uur gaans, met de aanvrager in overleg te treden over een alternatief voor uitlening. 
Maar, de afstand tussen de Universiteit Leiden en het Nationaal Archief is volgens Google: 19,8 km (21 minuten met de auto).

Met andere woorden, het mag wel, maar ik ben wel heel erg benieuwd naar de inhoud van het "uitleningsbesluit" en de eventueel daarin gestelde beperkingen.

donderdag 8 december 2011

Briefgeheim in de grondwet

Tjonge, nu dacht ik toch eigenlijk dat we dit al lang beter geregeld hadden. Maar nee hoor, artikel 13 van de Nederlandse Grondwet luidt nog altijd:
Artikel 13
  1. Het briefgeheim is onschendbaar, behalve, in de gevallen bij de wet bepaald, op last van de rechter.
  2. Het telefoon- en telegraafgeheim is onschendbaar, behalve, in de gevallen bij de wet bepaald, door of met machtiging van hen die daartoe bij de wet zijn aangewezen.
Vorige week heeft minister Donner de kamer echter laten weten dat hij voor het zomerreces van 2012 een westvoorstel in consultatie zal geven.
Het  voorstel  dat  het  kabinet  zal  voorbereiden  tot  herziening  van  dit grondwetsartikel  beoogt  in  het  bijzonder  de  geslotenheid  van  het  artikel  –  tot uitdrukking komend in de drie specifiek vermelde communicatiemiddelen - weg te nemen en daarmee het door artikel 13 Grondwet te beschermen belang niet langer afhankelijk te laten zijn van de daarin genoemde drie communicatiemiddelen.
Hierbij zullen in ieder geval ook het advies van de Staatscommissie Grondwet (zie eindrapport uit 2010 p. 85 ev) en het rapport van de Commissie Grondrechten in het digitale tijdperk (p. 135 ev).
Het duurt nog even, maar dan heb je misschien ook wat...

Gerelateerd
Geheimen en openbaarheid

Afbeelding
Op zoek naar een illustratie bij dit bericht ben ik een beetje gedeprimeerd geraakt van de kaarten op http://www.postsecret.com/... Vandaar maar een mooie oude PTT-brievenbus door marie-II

woensdag 7 december 2011

URL-verkorters bewaren

Een jaar of twee geleden schreef ik op Archief 2.0 een stukje over het archiveren van tweets en de problemen die het gebruik van URL-verkorters (zoals bit.ly,  tiny.cc of tr.im - o nee, die laatste toch niet) oplevert. Deze week ontdekte ik dat The Internet Archive daar ook een voorziening voor heeft: 301 works
301Works.org is an independent service for archiving URL mappings. The goal of the service is to provide protection for every day users of short URL services by providing transparency and permanence of their mappings. Shortened URL archives are in accordance with 301Works.org membership terms. Items contained in the archives are not publicly accessible at this time.
Het principe is heel simpel:

  1. Participating companies will regularly back up their URL mappings (short and long URLs pairs) to the service provided by the Internet Archive, using one of the supported formats. "Regularly" shall be interpreted as at least once per month. The current support format is a .csv text file, with the following fields: 1/ long url, 2/ short URL, 3/ (optional) click count, and 4/ (optional) date of creation.
  2. In the case of closure of the URL shortening service, a participating company will agree to transfer technical control of the shortening service domain so that 301Works can perform the redirection of shortened URLs. Note: This does not mean that the company will transfer ownership of the domain in such a case. Likewise, a closing company will agree to allow 301Works to publish the mappings so that users can remap any shortened URLs they may be using.
(Ik wilde deze blog beëindigen met de vraag "Heb jij je tabellen al aangeleverd Bob?", omdat ik Bob Coret nog wel eens zie verwijzen naar via.coret.org. Ik dacht dat hij een eigen shortener had gemaakt en gebruikt, maar bij nader inzien gebruikt hij de bit.ly-api, geloof ik.)

Gerelateerd
Universele toegang tot alle kennis

Plaatje: Bit.ly, a simple url shortener van twitter.com/a3munier

dinsdag 6 december 2011

Een dunne lijn...

Een van de bijzondere aspecten van het werken als inspecteur is de noodzakelijke neutraliteit en onafhankelijkheid. Ik kwam deze week onderstaande passage tegen in de eisen die de CCSDS stelt aan degene die digitale depots willen certificeren op basis van Audit and Certification of Trustworthy Digital Repositories, die dit, naar mijn idee, redelijk goed omschrijft:
Members of certification bodies can carry out the following duties without their being considered as consultancy or having a potential conflict of interest:
a) arranging and participating as a lecturer in training courses, provided that, where these courses relate to digital preservation management, related management systems or auditing, certification bodies should confine themselves to the provision of generic information and advice which is freely available in the public domain; i.e., they should not provide company-specific advice which contravenes the requirements of b) below;
b) adding value during certification audits and surveillance visits, e.g., by identifying opportunities for improvement, as they become evident during the audit, without recommending specific solutions. However the certification body shall be independent from the body or bodies (including any individuals) which provide the internal self-assessment of the client organization’s repository subject to certification.
Ik geef dus wel algemene, openbaar toegankelijke presentaties tijdens bijvoorbeeld het Doxis-seminar, de Vergeb-dagen of het PDF/a-seminar, maar ik ga niet in op verzoeken van adviesbureaus of software-leveranciers om bij hun intern een cursus, workshop of sessie te geven.
Tijdens inspectiebezoeken of overleggen over voorgenomen vervangingsbesluiten, geef ik dus wel globaal aan hoe een knelpunt opgelost of verbeterd kan worden, maar zal ik nooit tot in detail bechrijven hoe dit gerealiseerd zou kunnen of moeten worden.
Dit weblog en de manier waarop ik Twitter gebruik, passen hier volgens mij ook in: ik ben aanspreekbaar op mijn daden en meningen en schrijf (met een enkele uitzondering) nauwelijks over specifieke incidenten of gebeurtenissen uit mijn "inspectiepraktijk." Je kunt me alles vragen (zolang het maar enigszins "archiefgerelateerd" is), maar ik geef niet op alles het specifieke antwoord dat je misschien zou willen krijgen.

Het is een dunne lijn, maar ik geloof nog altijd dat het balanceren redelijk goed lukt.

Gerelateerd
Wek vrees op, tutoyeer niet
Hoe moet een inspecteur opereren?

Plaatje: Balancing Act van Digitalnative

maandag 5 december 2011

De samenwerking tussen de KB en Google #WOB

Twee weken geleden kreeg ik van de KB antwoord op mijn tweede WOB-verzoek. In een uitgebreide brief van vier kantjes, geeft meneer Savenije, de directeur, aan welke documenten wel en welke niet beschikbaar gesteld zullen worden via de KB-site.

(Zijstapje: het valt me nu trouwens op dat de KB zijn webpagina's geen datering meegeeft. Niet in de gewone tekst, maar ook niet in Dublin Core-tags. De KB geeft helemaal geen metadata mee...)

Ik heb de afgelopen dagen de stukken uitgebreid bekeken en me de vragen gesteld: "Weet ik nu wat ik wil weten? Welke nieuwe informatie hebben deze documenten opgeleverd?"
Hoe graag ik ook een positief geformuleerd antwoord zou willen geven, ik kom steeds uit op de informatie die ik uiteindelijk niet gekregen heb.

Wat weet ik nu wel? 
1. De KB heeft voor het afsluiten van het contract werkbezoeken gebracht aan het Scancentrum van Google, de Osterreichische Nationalbibliothek, De Bayerische Staatsbibliothek en de Universiteitsbibliotheek van Gent en deze bezoeken hebben "waardevolle input opgeleverd voor het project bij de KB." Maar wat die input precies was, weet ik niet, omdat eventuele bezoekverslagen of conclusies niet openbaar gemaakt zijn.

2. Op 20 juli 2010 hebben de directeuren van de KB en UB Leiden namens het Consortium Libratory een brief verzonden over het contract met Google. Libratory is een "onderzoekslaboratorium voor de geesteswetenschappen", waar dus in ieder geval de KB en de UB Leiden aan deelnemen. Aan wie de brief verzonden is, is om onduidelijke redenen weggelakt en wie er nog in het Consortium zitten i ook onduidelijk.
Het opvallendste aan dit document is trouwens dat het naast het contract het enige document is waarvan de datum niet is weggelakt.

3. De KB stopt om de een of andere reden boeken in een Tyvek-enveloppe. Geen idee waarom (daar heb ik ook niet om gevraagd), maar blijkbaar kunnen deze documenten niet gescand worden. Net zoals boeken met meer dan 10 losse bladen en boeken die niet ver genoeg open kunnen ook niet gescand kunnen worden.
Interessant is ook dat blijkbaar bij circa 1% van de boeken de vastgelegde metadata niet kloppen en dat ongeveer 1,5% van de boeken pagina's bevatten die nog niet zijn opengesneden. (Onduidelijk is of deze boeken wel gescand worden en wie dan verantwoordelijk is voor het opensnijden: Google of de KB.)

4. De KB heeft de realisatie van het contract met Google in twee deelprojecten opgedeeld: voorbereiding en uitvoering. Deelproject voorbereiding liep van 1 maart tot en met 31 oktober, maar het is onduidelijk in welk jaar. De resultaten van dit deelproject waren:
  1. Documentatie over Copyright en Selectie
  2. Uitwerking Workflow tot op werkinstructieniveau
  3. Google bezit alle benodigde documentatie en informatie
  4. Infrastructuur voor informatie-uitwisseling
  5. Projectplan voor deelproject 2 - Uitvoering van het Google-project
Over punten 2 en 5 heeft de KB informatie openbaar gemaakt en van punt 4 vind ik het terecht dat ze daarover vanuit het oogpunt van informatiebeveiliging niets openbaar maken. Maar dat over de punten 1 en 3 helemaal niets openbaar is gemaakt, snap ik niet. Volgens mij heb ik daar expliciet om gevraagd.

5. Voor de uitvoering van het project zijn aan de KB kant 3,4 fte nodig, waarvan iets meer dan 2 fte nodig is voor het verzamelen, versturen en retour ontvangen van de boeken. De voorbereiding heeft ongeveer €3.500,- gekost, exclusief de 150 uur die een ontwikkelaar nodig had om een database te maken. Hoewel, die database is blijkbaar ook bruikbaar voor een ander "geheim" project en de kosten worden daar op weggeschreven.

Wat weet ik nog niet?
1. Met uitzondering van 1 volledige en twee halve data, zijn alle data in de openbaar gemaakte documenten weggelakt. Van geen enkel document valt dus vast te stellen wanneer het is opgesteld. Dit belemmert de interpretatie van de stukken, doordat het nu onmogelijk is om een tijdlijn te maken. De documenten Resultaten collectiesurvey en pilot Google en de Nederlandse en Engelse "Vragen en antwoorden" zijn helemaal niet te interpreteren, omdat ze niet alleen geen datum hebben, maar ook niet in de huisstijl van de KB zijn opgemaakt (in tegenstelling tot bijvoorbeeld de memo over de database). De status is dus zeer onduidelijk.

2. Hoewel ik er expliciet naar gevraagd heb, heb ik geen informatie gekregen over de manier waarop de selectie van te scannen boeken tot stand komt (punt 1 onder 4 hierboven). Verder weer ik ook niet welke documenten niet gescand mogen of kunnen worden. Er is voor Google blijkbaar een beperking in het formaat (grootte en dikte) en de "openingsgraad" van de boeken. Maar er zijn ook criteria opgesteld voor en afspraken gemaakt over het al dan niet scannen van kostbare en kwetsbare boeken. Die zijn niet openbaar gemaakt.

3. Ook naar het projectplan uit artikel 1.11 van het contract heb ik expliciet gevraagd, maar dat is niet openbaar gemaakt. Terwijl er in het antwoord op vraag 15 in de "Vragen en antwoorden" ook nog eens nadrukkelijk naar verwezen wordt.

4. Doorlooptijd en scansnelheid worden angstvallig geheim gehouden. Alle passages waaruit zou kunnen blijken hoe vaak Google hoeveel boeken komt ophalen zijn weggelakt.

5. Informatie die voorafgaand aan, bij en na het afsluiten van het contract is uitgewisseld heb ik nauwelijks gekregen. De KB zegt, dat de eerste besprekingen met Google mondeling plaats gevonden hebben en OCW ook enkel mondeling op de hoogte is gebracht. Dus er zijn geen documenten die openbaar gemaakt kunnen worden.
Maar belangrijker nog is dat de informatie die wel uitgewisseld is (voornamelijk via e-mail blijkbaar) "bedrijfsgeheimen" van Google en de KB bevat. Deze informatie wordt dus op grond van artikel 10 niet openbaar gemaakt.
Een derde argument van de KB om geen informatie openbaar te maken is de "non-disclosure agreement" die de KB en Google met betrekking tot alle in deze fase uitgewisselde informatie hebben afgesloten.
Wat het eerste argument betreft: ik geloof best dat die eerste contacten mondeling gelegd zijn, maar het lijkt me toch dat hierover ook in bijvoorbeeld een bestuursvergadering of directie-overleg gesproken is. En daar zijn dan toch verslagen van gemaakt waarin een en ander wordt vastgelegd?
De tweede reden om informatie niet openbaar te maken is een lastige. Omdat ik als burger de inhoud van die e-mails en documenten niet ken, kan ik ook niet beoordelen of de KB hier terecht aangeeft dat het om concurrentie-gevoelige informatie gaat. Mij lijkt het sterk dat alle uitgewisselde informatie zo gevoelig is.
Dat brengt me bij het derde punt: het feit dat er een afspraak met Google is om geen enkele informatie openbaar te maken lijkt mij problematisch. Op deze manier wordt een afspraak met een buitenlands bedrijf gesteld boven de Nederlandse wet. Dat lijkt me zeer discutabel. Waar nog bij komt, dat die non-disclosure helemaal niet zo absoluut lijkt te zijn als de KB suggereert. De voorlaatste zin uit artikel 6.1 van het contract luidt namelijk:
The recipient may also disclose Confidential Information when required by law after giving reasonable notice to the discloser.
Misschien is de WOB wel een wet die eist dat de informatie openbaar gemaakt wordt?

Alle andere informatie die intern is uitgewisseld, inclusief de overwegingen waarom wel (of niet) voor Google gekozen zou moeten worden, worden geschaard onder "intern beraad". Dus wordt er op grond van artikel 11, lid 1, geen enkele overweging openbaar gemaakt.
Ik vind dit zeer onbevredigend, aangezien op deze manier op geen enkele manier gecontroleerd kan worden waarom de KB voor Google gekozen heeft. Ik neem aan dat iedereen die iets gezegd heeft over de Google-deal dit vanuit zijn formele functie binnen de KB-organisatie gedaan heeft. Ik ben ook niet geïnteresseerd in namen en rugnummers. Ik wil de afwegingen zien. En op grond van het tweede lid van artikel 11 kan dat best:
Over persoonlijke beleidsopvattingen kan met het oog op een goede en democratische bestuursvoering informatie worden verstrekt in niet tot personen herleidbare vorm. Indien degene die deze opvattingen heeft geuit of zich erachter heeft gesteld, daarmee heeft ingestemd, kan de informatie in tot personen herleidbare vorm worden verstrekt.
6. Om aan mijn vragen tegemoet te komen, heeft de KB een lijstje met Vragen en antwoorden (in het Nederlands en het Engels) samengesteld. Heel interessant, maar nauwelijks nieuwe informatie. Sterker nog, in vraag 15 wordt verwezen naar een document (het projectplan) dat de KB weigert openbaar te maken!

Naar aanleiding van in ieder geval deze zes punten ga ik de komende week maar werken aan een bezwaarschrift. Dat moet uiterlijk 29 december bij het Algemeen Bestuurscollege binnen zijn.
Advies en tekstvoorstellen zijn uiteraard welkom.

Gerelateerd
Daar zijn ze dan: de KB-Google-documenten #wob

zaterdag 3 december 2011

Universele toegang tot alle kennis

Brewster Kahle en The Internet Archive (foto Gawker)
De omvang en groei van Archive.org blijft onvoorstelbaar.
Op Long Now geeft Stewart Brand een korte samenvatting van wat Brewster Kahle en kornuiten allemaal voor elkaar hebben gekregen en krijgen:

Boeken
Voor de "Internet bibliotheek" zijn al 3 miljoen boeken gescand en er staan wereldwijd 29 scanrobots die hier iedere dag 1.000 boeken aan toevoegen, "digitized into every handy ebook format, including robot-audio for the blind and dyslexic."
Even modern heavily copyrighted books are being made available for free as lending-library ebooks you can borrow from physical libraries—100,000 such books so far. (Kahle announced that every citizen of California is now eligible to borrow online from the Oakland Library’s “ePort.”)
Muziek
Er zijn wereldwijd tot nu toe blijkbaar tussen de 2 en 3 miljoen "records" gemaakt, maar die zijn juridisch streng bewaakt. Maar, toen Internet Archive de muzikanten onbeperkte en "eeuwige" opslag aanbod, stroomde de muziek naar binnen.
The Archive audio collection has 100,000 concerts so far (including all the Grateful Dead) and a million recordings, with three new bands every day uploading.
Bewegend beeld
Net als liedjes, zijn de 150.000 commercieel geproduceerde films juridisch onaantastbaar, maar daarnaast zijn er nog 2 miljoen andere films, waarvan er nu al 600.000 toegankelijk zijn. En
In the year 2000, without asking anyone’s permission, the Internet Archive started recording 20 channels of TV all day, every day.
Internet
Toen The Internet Archive in 1996 begon, waren er "slechts" 30 miljoen webpagina's. Nu kopieert de Wayback Machine om de twee maanden "iedere" webpagina, waarna ze doorzoekbaar zijn in de database die 150 miljard pagina's bevat en 6 petabyte groot is.
It has 500,000 users a day making 6,000 queries a second.
Bibliotheek van Alexandrië
Het ideaal van Kahle is een verbeterde versie van de Bibliotheek van Alexandrië, die vooral beroemd is omdat hij verbrand is.
To maintain digital archives, they have to be used and loved, with every byte migrated forward into new media evey five years. For backup, the whole Internet Archive is mirrored at the new Bibliotheca Alexadrina in Egypt and in Amsterdam. (“So our earthquake zone archive is backed up in the turbulent Mideast and a flood zone. I won’t sleep well until there are five or six backup sites.”)
Over de organisatorische duurzaamheid stelt Kahle tenslotte, en ik vermoed dat hij hierbij onder andere op Google doelt, dat non-profit organisaties aantoonbaar langer bestaan dan bedrijven.
It might be it’s because they have softer edges, he surmised, or that they’re free of the grow-or-die demands of commercial competition. Whatever the cause, they are proliferating.
Wat zijn wij dan toch allemaal nog maar krabbelaars...

Aanvulling, zaterdag 3 december 2011, 13:16
Hier kun je een podcast van de hele lezing  van Kahle, waar dit een samenvatting van is, downloaden.

Gerelateerd
The Internet Archive gaat boeken bewaren
Het Nederlandsch Archievenblad, dat is science-fiction

vrijdag 2 december 2011

Online handel in cultuurgoederen

De originele pagina is offline, deze komt uit de Google Cache
Klik op het plaatje voor een leesbare versie.
Vorige week heeft staatssecretaris Zijlstra het Erfgoedinspectie-rapport De Kunst van het Internet, een onderzoek naar de online handel in cultuurgoederen aangeboden aan de Tweede Kamer.
Ik heb van het rapport alleen nog maar de management-samenvatting en een paar losse paragrafen gelezen. Wat me vooral opvalt: documenten (of preciezer misschien, archiefstukken) komen in het hele onderzoek nauwelijks voor. Behalve in deze passage:
Begin 2010 berichten verschillende media over een zaak in Italië, waarbij een museummedewerker bijna 1.500 gestolen historische documenten aanbood op internet.24 Doordat op foto’s van de objecten stempels van het museum te zien waren, kwam de verkoop aan het licht.
In het rapport wordt wel nadrukkelijk verwezen naar het UNESCO-verdrag 1970 inzake onrechtmatige invoer, uitvoer of eigendomsoverdracht van cultuurgoederen waar in artikel 1 staat:

For the purposes of this Convention, the term `cultural property' means property which, on religious or secular grounds, is specifically designated by each State as being of importance for archaeology, prehistory, history, literature, art or science and which belongs to the following categories:
[...]
(j) archives, including sound, photographic and cinematographic archives;
Tot zover dus de integraliteit bij de Erfgoedinspectie, want de sectie Archieven is (of was) bezig met een onderzoek naar diefstal van archiefstukken. Daar is in Leeuwarden tijdens de KVAN-dagen, nog een hele sessie aan gewijd. Blijkbaar was het niet interessant om te kijken of die archiefstukken ook via Marktplaats of eBay verhandeld werden...

Gerelateerd
Archiefpolitie
Archiefpolitie - revisited
Diefstal in het Stadsarchief
Over verdwenen decoraties uit een archief
De archiefdief documenteert natuurlijk alles

donderdag 1 december 2011

Gezien: Intergalactic Lovers en dEUS

Afgelopen zaterdag zag ik in de Limburgzaal in Heerlen Intergalactic Lovers en dEUS. Mijn makkers waren na afloop heel enthousiast, net als Harry Prenger, maar ik heb toch wat bedenkingen.
Van Intergalactic Lovers had ik graag meer gehoord, hun album Greetings & Salutations (Spotify) luister ik de laatste tijd regelmatig en ik had ze dus ook wel wat langer dan een klein half uurtje willen zien. Ze komen in januari nog naar Maastricht zag ik...
Het optreden van dEUS kon me eigenlijk niet zo boeien. Ze speelden redelijk goed, maar ik kreeg niet de indruk dat ze het echt leuk vonden. Mauro pronkte nu en dan wel wat met zijn gitaar, maar verder hadden ze net zo goed voor een lege zaal kunnen staan of misschien wel kunnen playbacken. (Maar misschien was het publiek daar zelf ook wel debet aan. Zoals je in het filmpje hierboven hoort, werd er constant door het concert heen gekletst. Een Concertgebouwstilte hoeft voor mij ook niet, maar waarom zou je naar een concert gaan als je er constant door heen kletst?)
Ik weet dat ze al jaren geleden uit de band zijn gestapt, maar ik miste toch de gekte van Rudy Trouvé en Stef Kamil Carlens, die de twee optredens die ik in de jaren negentig zag zo enerverend maakte. Daarom hieronder nog eens Suds & Sodas (dat ze zaterdag niet speelden) uit de 2 meter-sessie uit 1995.