woensdag 30 november 2011

Facebook mag de wet niet meer overtreden

Precies acht maanden geleden schreef ik over de schikking die Google met de Federal Trade Commission (FTC) gesloten had over de misleidende privacy-beloften ten aanzien van Buzz. En gisteren maakte de FTC bekend een gelijksoortige schikking met Facebook te willen sluiten. De Commission heeft onder andere vastgesteld dat:

  • In December 2009, Facebook changed its website so certain information that users may have designated as private – such as their Friends List – was made public. They didn't warn users that this change was coming, or get their approval in advance.
  • Facebook represented that third-party apps that users' installed would have access only to user information that they needed to operate. In fact, the apps could access nearly all of users' personal data – data the apps didn't need.
  • Facebook told users they could restrict sharing of data to limited audiences – for example with "Friends Only." In fact, selecting "Friends Only" did not prevent their information from being shared with third-party applications their friends used.
  • Facebook had a "Verified Apps" program & claimed it certified the security of participating apps. It didn't.
  • Facebook promised users that it would not share their personal information with advertisers. It did.
  • Facebook claimed that when users deactivated or deleted their accounts, their photos and videos would be inaccessible. But Facebook allowed access to the content, even after users had deactivated or deleted their accounts.
  • Facebook claimed that it complied with the U.S.- EU Safe Harbor Framework that governs data transfer between the U.S. and the European Union. It didn't.
In de voorgestelde schikking staat onder andere:
  • barred from making misrepresentations about the privacy or security of consumers' personal information;
  • required to obtain consumers' affirmative express consent before enacting changes that override their privacy preferences;
  • required to prevent anyone from accessing a user's material more than 30 days after the user has deleted his or her account;
  • required to establish and maintain a comprehensive privacy program designed to address privacy risks associated with the development and management of new and existing products and services, and to protect the privacy and confidentiality of consumers' information; and
  • required, within 180 days, and every two years after that for the next 20 years, to obtain independent, third-party audits certifying that it has a privacy program in place that meets or exceeds the requirements of the FTC order, and to ensure that the privacy of consumers' information is protected.
En er staan nog een paar interessante dingen in het persbericht. Het ene is dat in de schikking ook "standard record-keeping provisions" zijn opgenomen, die er voor moeten zorgen dat de FTC de komende jaren kan controleren of Facebook zich aan de afspraken houdt.
Het andere opvallende is dat de schikking nog slechts een "voorstel" is. Tot 30 december kan iedereen commentaar geven op de tekst van de schikking. Daarna zal de FTC de schikking pas definitief maken.
Opmerkingen kunnen digitaal ingediend worden en uiteraard ook analoog. Maar:
The FTC is requesting that any comment filed in paper form near the end of the public comment period be sent by courier or overnight service, if possible, because U.S. postal mail in the Washington area and at the Commission is subject to delay due to heightened security precautions.
Gerelateerd
Google, Buzz, privacy en liegen
Schaduwprofielen bij Facebook (en Google)

Plaatje: Facebook's privacy policy explained van Weisunc (naar aanleiding van
Facebook Privacy: A Bewildering Tangle of Options)

dinsdag 29 november 2011

Manifest voor Kwaliteitsmodel Inspectie

Gisteren organiseerde BRAIN in Almere de Dag van de Kwaliteit (pdf), waar het Kwaliteitsmodel Inspectie werd gepresenteerd. Hierboven zie je het daar bij horende Manifest. Het is een aardig filmpje, al is het alleen maar omdat ik het er nu en dan niet helemaal mee eens ben.
Als het over het kwaliteit van het archief gaat (vanaf 1.51) zegt "de stem" bijvoorbeeld dat de archivaris en de secretaris toezien op het beheer van archieven die nog niet zijn overgebracht. Het lijkt een detail, maar de gemeentearchivaris heeft toezicht op alle niet-overgebrachte archieven. Dat wil dus zeggen ook de archieven die helemaal niet overgebracht zullen worden (omdat ze op termijn te vernietigen zijn).
Daarnaast vind ik het problematisch om te zeggen dat de secretaris toezicht uitoefent als er geen archivaris benoemd is. In de praktijk is de secretaris namelijk "de beheerder" van het archief (niet-overgebracht en overgebracht). Dan kan hij dus geen toezicht uitoefenen op het beheer.
Ik vraag me ook af of het bij het toezicht wel gaat om "compliance & efficiency." Volgens mij stelt artikel 32. 2 van de Archiefwet, waar dit toezicht op gebaseerd is, dat het enkel om compliance gaat:
Ten aanzien van het beheer van de archiefbescheiden van de gemeentelijke organen, voorzover deze archiefbescheiden niet zijn overgebracht naar een archiefbewaarplaats, is, onder de bevelen van burgemeester en wethouders, met het toezicht op de naleving van het bepaalde bij of krachtens deze wet belast de gemeentearchivaris.
Hier staat niets over doelmatigheid.
Tenslotte wordt ook nog verwezen naar de wijzigingen in het interbestuurlijk toezicht, die tot gevolg zullen hebben dat de gemeentelijk archiefinspecteurs "hoogstwaarschijnlijk nog meer op hun bord gaan krijgen." Eerlijk gezegd vind ik dit een rare uitspraak, omdat de gemeentelijke inspecteurs volgens mij gewoon moeten blijven doen wat ze nu ook al zouden moeten doen. De inhoud van artikel 32.2 verandert volgens mij niet.

Maar goed, dat is een beetje geneuzel in de marge, want over het algemeen vind ik het goed dat BRAIN nu eindelijk eens serieus aandacht besteed aan inspectie en controle.
Als ik het manifest goed begrijp, heeft de werkgroep gisteren drie zaken opgeleverd:

  • Een procesmodel - ik denk dat hier in beschreven staat hoe je een inspectie aanpakt / organiseert
  • Zeven fundamentele vragen
  • Een quickscan
Alleen jammer dat ik dit nog nergens op de site van BRAIN heb kunnen vinden. Maar dat komt vast binnenkort.

Aanvulling, dinsdag 29 november 16:06
Ondertussen zijn verschillende documenten via BREED beschikbaar

Gerelateerd

zaterdag 26 november 2011

Street View in België en Duitsland

Bumba in Plopsaland Coo op StreetView
Het was alweer lange tijd rustig rond Google Street View (het laatste bericht op dit blog dateert alweer van 23 augustus), maar afgelopen week was het weer raak: Street View werd gelanceerd in België...
Prompt weer dezelfde taferelen als eerder in Nederland en Duitsland. Een stuk of wat mensen klaagden bij de Belgische Privacy-toezichthouder en een woordvoerder van de Belgische politiebond is er van overtuigd dat vooral inbrekers baat hebben bij de straatfoto's. Daarom gaat de politiebond er voor zorgen dat Street View offline gaat of alleen maar toegankelijk is voor de politie en makelaars (alsof die laatsten geen bandieten zijn...)

Ik heb afgelopen week geprobeerd om te achterhalen of het verschijnen van Street View ergens echt tot meer inbraken heeft geleid, maar heb hier nog geen bevestiging of ontkrachting van gevonden. Time schrijft, in een vertaling van een artikel uit de Süddeutsche Zeitung:
Serial break-ins that some thought would be a result of the service did not materialize. Nor, in the end, did people whose houses and apartments are pictured by the service protest much about having their private residences on display for the whole world to see. The software is apparently not of interest to wrongdoers and voyeurs. It is, however, popular among people trying to determine if they want to visit an area or buy or rent a home there.
In een ander artikel, gebaseerd op een onderzoek van Friedland staat dat 74% van de ondervraagde ex-inbrekers denkt dat andere inbrekers geregeld gebruik maken van Street View bij het voorbereiden van "klusjes". Probleem met het onderzoek is natuurlijk dat het maar om vijftig ondervraagden gaat en dat er niet gevraagd is of zij zelf Street View gebruikt hebben (of eventueel zullen gaan gebruiken).
En ik heb één zaak gevonden waarin iemand claimt dat er bij hem is ingebroken, omdat de inbrekers op Street View gezien hebben dat hij een fiets, diepvries, wadroger en gereedschap in zijn garage had staan.
Rayner and his wife have lived at the address for eight years and claim they have never had any trouble before the Google Street View photos were published.
Niet alleen zijn dat spullen die zo ongeveer iedereen in zijn garage heeft staan, de relatie tussen oorzaak en gevolg lijkt me ook niet erg sterk. Misschien is er in diezelfde tijd ook wel een geit met twee hoofden geboren!
Dus, als nog iemand cijfers heeft die hier iets zinnigs over zeggen: reageer vooral even.

In datzelfde artikel in Time wordt trouwens ook beschreven hoe de Duitse publieke opinie nu, ruim een jaar nadat StreetView in Duitsland geïntroduceerd werd, luidt:
Another indication of acceptance is that when Microsoft announced it would be photographing German streets for Bing Maps Streetside, its Street View clone, only 80,000 people opposed. "Google Street View did the pioneering work, and now people know what the pictures look like when they're published," said Caspar. In the meantime, according to the Google spokeswoman Wagner, some who originally opposed having their property photographed now want their homes included in the service. Too late. Google promised German data-protection authorities it would make all opposed imagery unrecognizable.
En eerder dit jaar besloot Google ook al de Duite straatfoto's niet bij te werken. Er rijden wel Google-auto's rond, maar de opnamen die deze maken zijn enkel bedoeld om Google Maps actueel te houden. Daarmee wordt de Duitse Street View dus meteen een "historische rondrit".
Hieronder zie je bijvoorbeeld het gebouw van het Keulse stadsarchief, dat in maart 2009 helemaal is ingestort:


Grotere kaart weergeven

Gerelateerd
Googlization in De Balie
Vrouw klaagt Google aan om haar ondergoed
Misdaad op Google Street View

vrijdag 25 november 2011

Update-de-browser-van-je-ouder-dag

The Macy's Thanksgiving Day Parade, Pepper-Sprayed
Vandaag is het in de Verenigde Staten Black Friday: de vrijdag na Thanksgiving die meestal winkelend wordt doorgebracht. Alexis Madrigal bedacht dat het zinvol zou zijn om deze dag anders door te brengen: Friday is update your parents browser day!
Thanksgiving is coming up, that time when families gather together to share food, extend gratitude, and marvel at how Dad still uses Internet Explorer 6. No, seriously, Dad, how can you be using a browser developed during the Clinton administration? That was like 10 presidents ago.
This year, though, do something different. Don't just explain to Grandpa or Mom or your father-in-law that there is a whole world of secure web browsing out there. No, take a firm stand. Tell them they won't be able to watch funny fishing videos on YouTube with IE6 anymore. Usually, by this point, most parents are begging for help and you can extract excellent perquisites for your labor. That big bedroom your little sister got for some reason? Now's the time to finally occupy it. While you're at it, you will probably fix (or set up) the wifi, which you can helpfully explain is like Internet particles floating in the air.
Zullen wij dat dan maar met Kerstmis doen?

Ongeveer 15 procent van de bezoekers van dit weblog gebruiken nog Internet Explorer 7, IE6 is langzamerhand te verwaarlozen. Maar met in totaal bijna 45% is Internet Explorer wel nog altijd de meest gebruikte browser, gevolgd door Firefox en Chrome met beide 20%.

Gerelateerd
Internetverbinding en Internet Explorer

Plaatje: JoelnSouthernCa

donderdag 24 november 2011

Wob in de wereld

Documents waiting to be revised, organized and scanned sit in piles
at the former National Police archive in Guatemala City on Nov. 3, 2011.
 (AP Photo/Rodrigo Abd) © 2011 AP
Terwijl ik met mijn redelijk simpele WOB-verzoek bezig was (waarover later uiteraard meer) was Associated Press bezig met een wereldwijd WOB-verzoek. Volgens het persbureau zijn er in de wereld 105 landen plus de EU met een openbaarheidswet. In januari hebben die allemaal de volgende vragen ontvangen:
  1. Any documents, memos, reports, or other records that would show how many people have been arrested and how many convicted each year for the past ten years under federal anti-terrorism laws.
  2. Any documents, memos, reports, or other records that would show how many people have been detained without arrest each year for the past ten years for ties to terrorism.
  3. Any documents, memos, reports, or other records that would show the current status of people convicted and the sections and subsections of crime under which they have been convicted under antiterrorism laws during the past 10 years.
  4. Any documents, memos, reports, or other records that would show the nationality of those arrested and convicted under anti-terrorism during the past 10 years.
  5. Any documents, memos, reports, or other records that would show the names, dates and circumstances for people arrested under federal anti-terrorism laws for the past ten years.
  6. Any audits, surveys or studies of federal anti-terrorism published in the last 10 years.
Het antwoord van Nederland was volgens AP 2 dagen te laat en wordt omschreven als:
Dutch officials provided a partially responsive not useful promise to provide answers to one part of AP’s request.
Opvallend is trouwens, dat de vragen blijkbaar in het Engels gesteld werden en dat het OM in het Nederlands antwoordde. Ik wist niet dat je een WOB-verzoek ook in een andere taal dan het Nederlands en Fries kon indienen.
Nederland was met zijn "matige" antwoord natuurlijk geen uitzondering:
  • Only 14 countries answered in full within their legal deadline. Another 38 countries eventually answered most questions, at least providing data.
  • Newer democracies were in general more responsive than some developed ones. Guatemala confirmed the AP request in 72 hours, and sent all documents in 10 days. Turkey sent spreadsheets and data within seven days. Mexico posted responses on the Web. By comparison, Canada asked for a 200-day extension. The FBI in the United States responded six months late with a single sheet with four dates, two words and a large section blanked. Austria never responded at all.
  • More than half the countries did not release anything, and three out of 10 did not even acknowledge the request. African governments led the world for ignoring requests, with no response whatsoever from 11 out of 15 countries.
Wie alle antwoorden zelf wil bestuderen - en die zijn natuurlijk ook zeer de moeite waard - kan hier terecht.
Zo blijken in de afgelopen tien jaar wereldwijd op grond van anti-terrorisme wetgeving bijna 120.000 mensen te zijn gearresteerd. Iets meer dan 35.000 daarvan zijn ook daadwerkelijk veroordeeld. In Nederland ging het hierbij om respectievelijk 67 en 35 mensen.

Gerelateerd
Laten we het nog eens over de WOB hebben
Privacy, openbaarheid en digitale archieven

woensdag 23 november 2011

Wayback in de rechtszaal

Ik zou natuurlijk moeten schrijven over de voorgestelde wijziging van de Archiefwet, maar dat komt misschien later deze week nog wel een keer. Vandaag nog eens iets over webarchieven en rechtszaken.
In The Lawyers Weekly (wie leest hem niet...) staat deze week een artikeltje over het gebruik van de Wayback Machine in Amerikaanse en Canadese rechtszaken:
A notorious criminal trial in Toronto in 2005 saw the application of such evidence, to the annoyance of the trial judge and the embarrassment of counsel. The Crown was prosecuting three teenagers for the particularly gruesome murder of a 12-year-old boy. After a three-month trial, the case was remitted to the jury. While they were still deliberating, an enterprising newspaper reporter using the Wayback Machine discovered online postings that had been made but deleted by a key prosecution witness. The postings suggested she had perjured herself. When the judge read about this in the next day’s newspaper, the prospect of perjury compelled him to declare a mistrial.

Counsel then had to explain how they had failed to uncover such critical evidence despite months of trial preparation, particularly when a newspaper reporter had found it so easily. The judge was not impressed by their pleas that they were mere lawyers unfamiliar with Internet archives.
In het artikeltje wordt ook nog even in gegaan op de manier waarop webpagina's aan de rechter voorgelegd moeten worden. Blijkbaar gebeurt dit (in Canada) nog altijd op papier, want
Opposing counsel may agree to their admissibility and allow printouts to be included in an agreed exhibit book. If that is not possible, satisfying the trial judge will likely require evidence from someone explaining the nature of the Wayback Machine, its use and certifying the results.
If an affidavit from the client is deemed insufficient, the Internet Archive will, for a nominal fee, provide a sworn statement (www.archive.org/legal/affidavit.php) authenticating pages or other information from the Wayback Machine. Requests and payment can be submitted online or by regular mail.
Even aan Arnoud gevraagd of hier ook Nederlandse voorbeelden van zijn en prompt verwees hij me naar deze zaak, waarin iemand inderdaad verwijst naar de Wayback Machine. Onder 4.14 staat:
Dit zou onder meer blijken uit de door hen overgelegde uitdraai van het internetarchief ‘Wayback Machine’, een internetarchief dat het mogelijk maakt om oude versies van websites op te zoeken (...)
De rechter gaat verder niet in op de toelaatbaarheid van dit bewijs, maar er lijken geen redenen te zijn waarom dit bewijs door een rechter niet geaccepteerd zou worden.

Gerelateerd
Valse documenten in een rechtszaak

dinsdag 22 november 2011

De Toezicht-catalogus



Dit filmpje komt van de website van de Wall Street Journal: The Surveillance Catalogue - Where governments get their tools.
an online database containing highlights from surveillance industry marketing documents. The documents show dozens of companies making and selling everything from “massive intercept” gear that can gather all Internet communications in a country to “hacking” tools that allow governments to break into people’s computers.
Verontrustend leesvoer...

Gerelateerd
Backdoors en Bunderstrojaner
Gelezen: Ilija Trojanow, Juli Zeh - Angriff auf die Freiheit

maandag 21 november 2011

Bewaar als... Een praktische leporello


Digitale duurzaamheid lijkt ingewikkelder dan het is. Natuurlijk is het lastig en moet je er ook wel wat moeite voor doen. Maar zelf kunnen beslissen welke informatie, foto’s, filmpjes of projecten je over een aantal jaren nog tot je beschikking hebt, is toch ook wat waard. Er zijn een paar eenvoudige stappen waar je mee kunt beginnen. De inspanning hoeft niet groter te zijn dan het resultaat dat je wilt te behalen; over een jaar of twintig nog beschikken over een digitale geheugen
De volgende maatregelen neem je direct:
  1. Kies goede bestandsnamen
  2. Kies goede bestandsformaten
  3. Kies een goed passende strategie
  4. Orden en selecteer
Tot slot plan je jaarlijks onderhoud in.
Lees meer op Bewaar als... een handleiding digitaal archiveren voor ontwerpers van Premsela.org en de BNO, gemaakt door Karen van der Heiden. Eerder maakten zij ook al de "Beknopte handleiding archiveren voor ontwerpers."

Gerelateerd
Archiveren voor ontwerpers
Zonder jurk niets om te doen opwaaien

zaterdag 19 november 2011

Daar zijn ze dan: de KB-Google-documenten #wob

Post van de KB!
Een brief van vier pagina's waarin Savenije vertelt dat de bibliotheek allerlei relevante documenten op zijn website heeft gepubliceerd. (Voor de "zekerheid" heb ik de bestanden hier ook nog eens allemaal neergezet.)
Verder legt hij uit dat allerlei documenten niet openbaar gemaakt kunnen worden omdat ze bedrijfskritische informatie bevatten en omdat de KB een "non disclosure agreement" met Google heeft afgesloten. Allerlei interne e-mails en documenten worden betiteld als "intern beraad en persoonlijke beleidsopvattingen."
Verder kan allerlei informatie niet gegeven worden omdat er met name mondeling overlegd is:
Tijdens de onderhandelingsfase hebben mondelinge overleggen plaatsgevonden en zijn telefonische gesprekken met Google gevoerd [...]
Met betrekking tot de eerste vraag merken wij op dat wij hiervoor niet over documenten beschikken aangezien in de initiële fase louter mondeling is gecommuniceerd. [...]
Over de voorbereiding en afsluiting van het contract is mondeling overlegd met het ministerie van OCW[...]
Ik moet alle documenten eens rustig bestuderen om te bekijken of ik tevreden ben met het resultaat. Ik heb zes weken de tijd om eventueel bezwaar aan te tekenen tegen het besluit van de KB.

Gerelateerd
Een tweede WOB-verzoek voor de KB

Het Nederlandsch Archievenblad? Dat is science-fiction

Een van de dingen die ik voor de KVAN moet regelen is het laten digitaliseren van de oude jaargangen van het Nederlands Archievenblad. De KB heeft in zijn tijdschriften-project de jaargangen 1892 - 1940 van het Nederlandsch Archievenblad geselecteerd voor digitalisering. Dus de KVAN heeft voorlopig besloten om die jaargangen niet ook nog eens zelf te gaan laten scannen.
Eerder deze week stuurde een van mijn mede-bestuursleden me de link waar bovenstaande schermafdruk vandaan komt en waaruit blijkt dat oude jaargangen van het Nederlandsch Archievenblad al gescand zijn. Het eerste dat opvalt is natuurlijk dat het Archievenblad is gecategoriseerd als Science Fiction & Fantasy. Maar dat is nog niet alles.
Uit het bijschrift blijkt dat Allofebooks scans te koop aanbiedt die door Google gemaakt zijn voor de University van Michigan en daarna zijn geupload naar The Internet Archive. En na enig verder klikken blijkt dat er in The Internet Archive meer oude jaargangen van het Nederlands Archievenblad te vinden zijn! 
En je kunt ze ook nog eens in platte tekst downloaden en embedden:

Dat Google de jaargangen gedigitaliseerd heeft, blijkt ook uit de aanwezige "google fingers":

Nog verwonderlijker dan dit, vind ik de uitgaven die ik bij Amazon tegen kwam:

Voor krap $17,- kun je een "reproductie" van jaargang zeven van het Nederlandsch Archievenblad kopen:
This is a reproduction of a book published before 1923. This book may have occasional imperfections such as missing or blurred pages, poor pictures, errant marks, etc. that were either part of the original artifact, or were introduced by the scanning process. We believe this work is culturally important, and despite the imperfections, have elected to bring it back into print as part of our continuing commitment to the preservation of printed works worldwide. We appreciate your understanding of the imperfections in the preservation process, and hope you enjoy this valuable book.
Deze boeken worden uitgegeven door Nabu Press of BiblioBazaar, beide eigendom van BiblioLabs, dat zich op zijn website omschrijft als:
a hybrid media-technology company based in Charleston, South Carolina. We work with leading information organizations around the world to curate and commercially distribute historical and academic content.
Het is een wonderlijke wereld, want BiblioBazaar gaf in 2009 272.930 boeken uit, bijna evenveel als alle "traditionele" uitgevers bij elkaar!
En een ander onderdeel van BiblioLabs, BiblioLife, maakt allerlei apps voor iPhone en iPad, onder andere in samenwerking met de Britisch Library.

Gerelateerd
Is Google goed voor geschiedenis

vrijdag 18 november 2011

PDF/a, wat heb je daar aan?

Gistermiddag mocht ik in Woerden een presentatie houden tijdens het tweede jaarcongres pdf/a van het PDF/A Competence Center Benelux i.s.m. DO Consultancy.
Door wat logistieke problemen was het nog een beetje de vraag of ik Woerden wel zou bereiken, maar even na 13.00 (ruim een drie kwartier voor ik "op" moest) kwam ik aan bij de Concordia-zalen. Dientengevolge heb ik wel het hele ochtendprogramma gemist, dus ik heb geen idee wat Inge Angevaare en David van Driessche verteld hebben. Maar de drie presentaties die ik wel gezien heb, waren in ieder geval interessant.
Raph de Rooij, van Logius, beantwoorde de vraag op welke manier pdf/a past in de Webrichtlijnen. De vraag stellen is eenvoudiger dan beantwoorden, want het antwoord hangt aaneen van mitsen, maren en tenzijs.
Kortweg komt het er op neer dat je op grond van de Webrichtlijnen ieder "non-textual object" adequaat moet beschrijven. De reden hiervoor is dat iemand met een beperking (blinden bijvoorbeeld) ook in staat moeten zijn het bestand te lezen. Dit betekent dat gescande pdf-bestanden (hetzij pdf/a-1b of pdf/a-2b, waarover hieronder meer) meestal problematisch zijn. De "-1a" en "-2a" varianten zijn al wat minder bewerkelijk, maar blijkbaar moet je ongeveer ieder bestand handmatig langs de richtlijnen leggen. Een mogelijke oplossing zou kunnen zijn om van ieder pdf-bestand ook een html-versie "er naast" te zetten.
Dit is in de praktijk natuurlijk onhaalbaar, zeker als een overheid gescande documenten (bijvoorbeeld naar aanleiding van een WOB-verzoek) op zijn website publiceert. Om nog maar te zwijgen over een archiefdienst die gescande archiefstukken op zijn site publiceert. Als ik het goed heb is dit gedeeltelijk ook de reden voor die rare Gahetna.nl-truc van het Nationaal Archief. Doordat de site nu van "De Vrienden" ipv het Nationaal Archief is, hoeft de site niet meer aan de Webrichtlijnen te voldoen.
Correctie 19 oktober 2012: Zoals Yvette hieronder ook al schrijft en iemand me net nog eens op het hart drukte: Gahetna.nl heeft niets te maken met het al dan niet moeten voldoen de webrichtlijnen.

En eigenlijk is het ook van de gekke. Ik bedoel: natuurlijk hebben blinden ook recht op toegang tot informatie, maar hoe gaat het als een blinde naar de studiezaal van het NA (of een willekeurige andere archiefdienst gaat)? Moet de archiefdienst dan ook de analoge archiefstukken voor deze blinde omzetten in braille of voorlezen?

Daarna mocht ik uitleggen waarom de A van pdf/a niet voor "alles" staat.
Het is een variant op wat ik al vaker verteld heb: we moeten er langzaam toch aan geloven dat archiefstukken meer zijn dan digitale A4-tjes en we moeten dus afstappen van de notie dat we ALLE archiefstukken kunnen (of moeten!) archiveren in pdf/a. Voor heel veel archiefstukken kan dat helemaal niet. Bovenstaande presentatie bevat filmpjes en "gedrag", dat kan niet in PDF (en gedrag kan ook niet in Slideshare trouwens...).
Het jaarverslag van de Provinciale Archiefinspectie van Noord-Brabant en Limburg is een interactieve kaart, die nooit analoog heeft bestaan en ook niet analoog kan bestaan. Om nog maar te zwijgen over websites, zaaksystemen en back-office-applicaties. Zoals Carsten Heierman gisteren ook zei: "Pdf is digitaal papier. Alles wat je kunt printen, kan je in pdf bewaren." Met de rest kan dat dus nauwelijks!

Daarna legde Carsten Heierman van LuraTech in vloeiend Engels (met nu en dan een woordje Nederlands en Duits er tussen door) uit wat de belangrijkste verschillen zijn tussen pdf/a-1b en pdf/a-2b.
(Ik ga er even van uit dat het verschil tussen pdf/a-1a en pdf/a-1b bekend is, zo niet, dan kun je dit lezen.)
Allereerst maakte Heierman duidelijk dat Pdf/a-2 geen nieuwe versie van pdf/a-1 is. Het gaat om een aanvullend deel. Je hoeft je huidige pdf/a-1b bestanden dus niet te converteren naar pdf/a-2b. De "oude" standaard blijft gewoon geldig en bestaan.
Dan de verschillen: in "-2b" kunnen dingen die in "-1b" nog 'verboden' waren, zoals:
  • het opnemen van verschillende pdf/a-bestanden in één pdf/a-bestand, waardoor je een soort "dossier" krijgt. Het voorbeeld dat hierbij gegeven werd was: een e-mail met bijlagen. Je kunt dus een e-mail "printen" naar pdf en de printbare bijlagen aan die initiële pdf toevoegen. Mij lijkt het niet optimaal, want lang niet alle bijlagen zijn "printbaar" en het is zeker de vraag of het converteren van een e-mail naar pdf de beste oplossing is. (Waarschijnlijk niet, zeg ik er maar meteen bij... Als we op papier printen niet goed genoeg vinden, is het naar digitaal papier printen ook niet goed genoeg.)
  • JPEG2000-compressie is toegestaan, waardoor kleuren-scans een stuk hanteerbaarder worden. Dit leverde in de zaal meteen weer discussie tussen de rekkelijken en preciezen over de wenselijkheid van compressie... Ik ben rekkelijk.
  • In "-2b" kunnen nu pagina's met een maximaal formaat van 381 km bij 381 km opgenomen worden. In ""-1b" konden de pagina's niet groter zijn dan 5m bij 5m.
  • Transparantie en lagen zijn nu toegestaan
  • Unicode-codering van de OCR-tekst is mogelijk. Dit staat bekend als pdf/a-2u en heeft tot gevolg dat de OCR-tekst "beter" is, doordat ieder karakter beter en eenduidiger beschreven wordt.
De laatste presentatie was van Karin Heijn van NOiV. Het ging over "Pas toe of leg uit" en leidde weer tot een soort Calimero-discussie omdat toch "eigenlijk" de bestuurders zouden moeten snappen waarom het gebruik van open standaarden (over open source ging het gisteren niet) belangrijk is.

Gebruik formaat201020092008
ODF58%54%30%
PDF/a-1a58%44%38%
PDF 1.721%nvtnvt

En naar aanleiding van bovenstaand tabelletje naar aanleiding van een NOiV-enquete werd er gediscussieerd over wat het "gebruik" van PDF/a-1a door de overheid betekent. Colin van Oosterhout (van Adobe) noemde naar aanleiding van  een steekproef op websites van de Rijksoverheid namelijk een veel lager percentage van "goede" pdf-bestanden.

Zijdelings kwam ook nog even PDF/A-3 (je gelooft het niet...) aan de orde. Het blijkt dat je nu al "native" bestanden kunt embedden in PDF-bestanden. Dat betekent dat je bijvoorbeeld een Word- of Excelbestand in het PDF-bestand kunt opnemen. De PDF-"envelop" zorgt voor de weergave, maar als je de onderliggende data wil zien, kun je het bestand openen in bijvoorbeeld Excel. In de -3-versie wordt dit dus gestandaardiseerd.
Ik geloof niet dat ik dit vanuit het houdbaarheidsperspectief een heel erg fijn vooruitzicht vind: allerlei native, non-standaardbestanden verstoppen in een ander bestand, dat leidt geheid tot allerlei fouten op de iets langere duur...

Plaatje: letter A van Leo Reynolds

donderdag 17 november 2011

Google Transparency Report


In zijn Transparancy Report schrijft Google:
We've created Government Requests to show the number of government inquiries for information about users and requests to remove content from our services. We hope this step toward greater transparency will help in ongoing discussions about the appropriate scope and authority of government requests.
Our interactive Traffic graphs provide information about traffic to Google services around the world. Each graph shows historic traffic patterns for a geographic region and service. By illustrating outages, this tool visualizes disruptions in the free flow of information, whether it's a government blocking information or a cable being cut. We hope this raw data will help facilitate studies about service outages and disruptions.
Naast de visualisaties die Google hier zelf bij gemaakt heeft (bijvoorbeeld deze en deze) heeft het datablog van The Guardian de visualisatie hierboven gemaakt. De conclusies van The Guardian zijn:
  • The number of US government requests for data on Google users for use in criminal investigations rose 29% in the last six months. Google says it complied in whole or part with 93% of such requests
  • The US demanded private information about more than 11,000 Google users between January and June this year, almost equal to the number of requests made by 25 other developed countries, including the UK and Russia.
  • Governments around the world requested private data about 25,440 people in the first half of this year, with 11,057 of those people in the US
  • Google received 92 requests to remove data from its services, including YouTube. The requests collectively asked for 757 individual pieces of content be removed. Google says it complied fully or partially with 63% of the requests
  • US government agencies sent Google 5,950 criminal investigation requests for data on Google users and services in the first six months of 2011, an average of 31 a day
Overigens, in deze overzichten staan niet alleen "manipulaties" van Google. In de Faq staat:
Do your statistics cover all categories of content removals?
No. Our policies and systems are set up to identify and remove child pornography whenever we become aware of it, regardless of whether that request comes from the government. As a result, it's difficult to accurately track which of those removals were requested by governments, and we haven't included those statistics here. We counted requests for removal of all other types of content (e.g., alleged defamation, hate speech, impersonation). In addition, for YouTube, we generally have not included government requests for removal of copyrighted content unless there are extraordinary circumstances behind the request. The vast majority of requests for removal of copyrighted material on YouTube are received from private parties; some may come from state or foreign governments, but that number is very low. Regardless, such requests are not reflected in these statistics.
en
Do you ever remove content that violates local law without a court order or government request?
Yes. The statistics we report here do not include content removals that we regularly process every day across our products for violation of our content policies (for example, we do not permit hate speech in Blogger and other similar products) in response to user complaints. In many cases these requests result in the removal of material that violates local law, independent of any government request or court order seeking such removal.

woensdag 16 november 2011

De Archiefvisie in de Tweede Kamer

Eigenlijk had de Tweede Kamer donderdag 27 oktober moeten praten over de Archiefvisie, maar - waarschijnlijk door Mauro - is het er toen niet van gekomen. Dit mondeling overleg is toen omgezet in een "schriftelijk overleg".
Afgelopen maandag verscheen de inbreng van de verschillende fracties op Officiële bekendmakingen. Verschillende fracties stellen interessante vragen aan de Staatssecretaris. Een bloemlezing.
De leden van de PvdA-fractie merken op dat de visie sterk lijkt te leunen op een extern bedrijf. Zij zijn van mening dat dit niet erg is bij specialistische taken, maar zij vragen wel in hoeverre het geïnvesteerde geld ook een duurzame verbetering van de overheid als archiefbeheerder oplevert.
[...]
Tevens stellen zij vast dat de opleiding archivistiek in gevaar komt door de langstudeerdersmaatregel. Hoe garandeert de staatssecretaris dat de archieven ook over 20 jaar goed beheerd worden?
Deze leden merken op dat Digitaal Erfgoed Nederland haar (essentiële) rijkssubsidie verliest. Daarmee vervalt de ondersteuning voor veel (erfgoed-)archieven. Hoe is dat te rijmen met de ambities van de regering op het vlak van goede archivering, zo vragen zij.
De leden van de SP-fractie merken op dat de archiefvisie stelt dat toekomstige ontwikkelingen te ongewis zijn voor een blauwdruk. Maar juist het ongewisse zorgt ervoor dat de noodzaak om tot een goed uitgewerkte visie te komen groot is. De Raad voor Cultuur stelt dat de archiefvisie onvoldoende is uitgewerkt. De leden vragen de staatssecretaris om een reactie op deze kritiek te geven. Zorgvuldigheid is immers geboden, hoe gaat de staatssecretaris deze zorgvuldigheid garanderen, zo vragen deze leden.
Ten aanzien van het bestel vragen de leden van de VVD-fractie hoe de staatssecretaris de versnippering van ruim honderd, vaak kleinere instellingen zal tegengaan, en tegelijkertijd het archiefstelsel gaat hervormen zodat het ook digitale archivering behelst. De leden zijn erg benieuwd hoe de staatssecretaris invulling geeft aan een zorgvuldige uitwerking van beide ontwikkelingen.
Maar de kamerleden hebben ook wat minder geslaagde vragen:
De leden van de CDA-fractie stellen vast dat de archiefvisie zelf een groot probleem aankaart, namelijk de versnippering en het gebrek aan samenwerking tussen de instellingen en betrokkenen. De leden vragen of er voldoende kennis en overzicht bij de overheid is om dit vlot te trekken. Wie wordt in dezen de projectleider? De leden vragen de staatssecretaris of mogelijk de Koninklijke Bibliotheek hier een rol in kan spelen, aangezien hier al vanzelf overheidsarchieven en maatschappelijke archieven samenvloeien.
De rest van dit "niet-dossierstuk" (kan iemand mij deze term even toelichten?) gaat over de RHC's en de nieuwe selectieaanpak. Vooral ten aanzien van dat laatste worden ook een paar interessante vragen gesteld:
De leden van de CDA-fractie hebben kennisgenomen van de brief van de staatssecretaris over selectie. [...]
De staatssecretaris benoemt voor het strategisch informatieoverleg een onafhankelijk lid dat binnen het afwegingsproces een onafhankelijke stem heeft. De leden vragen de staatssecretaris wat hij daarbij voor ogen heeft. Deze leden stellen namelijk vast dat de check op de selectie komt te vervallen. Zou de benoeming van een lid van de Raad voor Cultuur in het strategisch overleg wellicht deze achterafcontrole kunnen vervangen, zo vragen deze leden.
Voorts merken deze leden [van de SP-fractie] op dat door het selectieproces dichter op het primair werkproces te brengen, er efficiënter wordt gewerkt. Zij vragen echter of dan het gevaar van een te pragmatisch oordeel niet te groot is. Is omkering niet logischer: niet de selectielijst aanpassen aan de archiveringspraktijk, maar de praktijk aanpassen aan wat behouden moet worden? Er wordt gesproken over checks and balances in het selectieproces. De leden vragen hoe die checks and balances eruit gaan zien, welke criteria gaan er komen voor de daadwerkelijke selectie. [...]
Tevens merken deze leden op dat er afspraken worden gemaakt met het driehoeksoverleg/strategisch informatieoverleg voor waardering en selectieaanpak. Dit overleg verschuift de nadruk van deskundigheid naar verantwoordelijkheid. De leden betwijfelen of de verantwoordelijke ambtenaar altijd de juiste persoon is om afwegingen te maken met betrekking tot de informatie. Zou dit niet overgelaten moeten worden aan een deskundige?
En nu is het wachten totdat de minister zijn antwoorden naar de Kamer stuurt...

Gerelateerd
Daar is hij dan, de #archiefvisie
Wat ik echt mis in de #archiefvisie
Nieuwe selectieaanpak #KVAN11
De Raad voor Cultuur oordeelt (2/2)

Plaatje: Storage Visions SD card holder van Laptop Magazine

SOPA: Stop Online Piracy Act

Even een "gratuit" protest-blogje tussendoor...
Van AmericanCensorship.org
On 11/16, Congress holds hearings on the first American Internet censorship system.
This bill can pass. If it does the Internet and free speech will never be the same.
Join all of us on the 16th to stop this bill.

Website Blocking
The government and corporations can order service providers to block websites for infringing links posted by any users.

Risk of Jail for Ordinary Users
It becomes a felony with a potential 5 year sentence to stream a copyrighted work that would cost more than $2,500 to license, even if you are a totally noncommercial user, e.g. singing a pop song on Facebook.

Chaos for the Internet
Thousands of sites that are legal under the DMCA would face new legal threats. People trying to keep the internet more secure wouldn't be able to rely on the integrity of the DNS system.
Lees meer bij Jeroen en Edwin

dinsdag 15 november 2011

Metadata in je plaatjes

Naar aanleiding van een tweet van Edwin las ik dit weekend de discussie op Archief 2.0 over watermerken in afbeeldingen nog eens helemaal. Een paar dingen vallen me nu op.
Een van de argumenten die gebruikt wordt voor het plaatsen van watermerken, is dat daarmee de metadata van de afbeelding te achterhalen zijn. Want:
Wij, archivarissen, besteden veel tijd en geld aan het beschrijven van het beeldmateriaal en vinden het daarom belangrijk dat de herkomst gewaarborgd blijft.
Bob heeft dit argument al grotendeels onderuit gehaald (want een watermerk bevat nauwelijks relevante metadata), maar ik zit ook nog even met de betekenis van het citaat hierboven.
Ja, archivarissen besteden veel tijd en geld (als het goed is bijna al hun tijd en geld) aan het beschrijven van archiefstukken. Maar die beschrijvingen gelden vooral voor de archiefstukken die zij in beheer hebben. Ik vraag me af of archivarissen ook verantwoordelijk zijn voor de metadata van de kopieën van archiefstukken die zij verstrekken aan derden. Naar analogie met een opmerking van Christian: als we een kopietje van een briefje uit een dossier maken, voegen we daar toch ook niet de hele beschrijving uit de inventaris aan toe?

Embedden
Iets anders wat opvalt, is dat de hoop gevestigd wordt op embedden, om op die manier de "link" naar de beheerder te bewaren. Hierbij gaat het om het embedden van het plaatje vanaf de servers van de archiefdienst. Bijvoorbeeld zoals ik eerder een plaatje vanuit Gahetna.nl in een blog over geweren geplaatst heb.
(Overigens en terzijde: het lijkt dus alsof je de foto's vanuit Gahetna.nl niet kunt downloaden, maar in de embed-code staat wel een rechtstreekse url naar het plaatje, waardoor dat bestand dus wel apart opgeslagen kan worden.)

Maar er is natuurlijk nog een andere manier van embedden...
De foto's hierboven en hieronder zijn afkomstig van het BHIC. Je kunt deze foto niet meteen embedden, maar wel downloaden. De foto hierboven is de versie zoals ik die gedownload heb, de foto hieronder heb ik ietwat gemanipuleerd.
Dat zie je niet aan de foto, maar aan de eigenschappen van het bestand. Om dit te zien zijn een paar extra stappen nodig...
Download alletwee de foto's en geef ze een afwijkende naam, open ze in bijvoorbeeld Picasa en bekijk de "Eigenschappen" (alt+enter). Bij de bovenste foto zie je dit:

Maar, bij de onderste foto zie je dit:

In de onderste zeven velden zie je dezelfde beschrijvingsgegevens als bij het BHIC op de website. Ik heb die velden op zondagavond met behulp van PhotoMe een beetje in het wilde weg ingevuld (ik heb ook nog ergens een url toegevoegd, maar die zie ik nu nergens meer terug), dus allerlei gegevens staan er dubbel in. Maar, met wat meer overleg moet het lukken om hier logische afspraken over te maken.

Dus, als we die metadata zo relevant vinden en als we het belangrijk vinden dat duidelijk blijft wat de bron van het plaatje is, is dit embedden dan niet een veel elegantere manier dan een lelijk watermerk?

Overigens, deze methode hoeft natuurlijk niet beperkt te blijven tot foto's, maar kan toegepast worden bij ieder digitaal archiefstuk dat beschikbaar gesteld wordt.

Bronnen en inspiratie
Het bovenstaande heb ik niet zelf verzonnen en is ook helemaal niet nieuw.
Ik moest er aan denken door een blog van de Library of Congres over het toevoegen van beschrijvingen aan foto's. Daarnaast eist een van de Brabantse archiefdiensten iets vergelijkbaar bij de vervanging van bouwvergunningen. Daar moeten in de "scanbestanden" ook allerlei context-data opgenomen worden. (Ik heb niet kunnen achterhalen of ze dit ook al doen bij de foto's uit hun beeldbank.)
En tenslotte is dit ook ongeveer wat David Bearman meer dan vijftien jaar geleden zei, toen hij het had over "metadata encapsulated objects" en de eis dat data-objecten die als records dienen "self documenting" zouden moeten zijn.

maandag 14 november 2011

Wanneer is vervangen echt vervangen?

Afgelopen weekend belandde ik met een handjevol vakidioten in een twitter-discussie over vervanging. Ik heb de meeste tweets in Storify verzameld. Niet allemaal, omdat een deelnemer achter een slotje zit, maar de teneur wordt wel duidelijk denk ik.
Uiteindelijk kwam het allemaal neer op die ene cruciale vraag:

Wanneer heb je een archiefstuk vervangen?

Eerst wat definities uit de Archiefwiki weergeven:
En daarna het relevante wetsartikel volledig citeren:

De zorgdrager is bevoegd archiefbescheiden te vervangen door reprodukties, teneinde de aldus vervangen bescheiden te vernietigen. Voor de vervanging van archiefbescheiden die niet als te vernietigen worden aangemerkt in de in artikel 5 bedoelde lijsten, is een machtiging vereist van Onze minister dan wel, indien het archiefbescheiden betreft voor de bewaring waarvan een andere dan een rijksarchiefbewaarplaats is aangewezen, van gedeputeerde staten. Deze machtiging houdt tevens een machtiging tot vernietiging in.

Ik heb hierin twee passages onderstreept.
De zinsnede "teneinde de aldus vervangen bescheiden te vernietigen" is cruciaal, maar helaas ambigu. Er staat in ieder geval dat het doel van het maken van de reproducties is om de originelen te vernietigen. Maar er staat ook dat de originelen vervangen zijn, simpelweg door het maken van de reproductie.
De tweede passage stelt dat machtiging tot vervanging ook een machtiging tot vernietiging inhoudt. Het idee hier achter is dat het permanent te bewaren archiefbescheiden niet vernietigd mogen worden maar naar een archiefbewaarplaats moeten worden overgebracht.

Een ander artikel dat hierbij relevant is, is artikel 8 van het Archiefbesluit (er zijn meer artikelen over vervanging, maar die doen nu even niet ter zake):

De zorgdrager maakt van de vernietiging, vervanging of vervreemding een verklaring op, die ten minste een specificatie van de vernietigde, vervangen of vervreemde archiefbescheiden bevat, alsmede aangeeft op grond waarvan en op welke wijze de vernietiging, vervanging of vervreemding is geschied. Een exemplaar van deze verklaring wordt bewaard door het overheidsorgaan waaronder de archiefbescheiden zouden berusten, indien zij niet waren vernietigd, vervangen of vervreemd.

Je moet dus iedere vervanging, vernietiging en vervreemding documenteren: om welke archiefstukken gaat het, waarom en op welke manier zijn ze vervangen, vernietigd of vervreemd. Hierbij maakt het niets uit of het gaat om te vernietigen of permanent te bewaren "originelen."

Mijn stellingen zijn...
  1. Het maken van reproductie R van archiefstuk A verandert niets aan de status van A. Dat is en blijft een archiefstuk tot aan zijn vernietiging.
  2. Als R gebruikt wordt bij de uitvoering van werkzaamheden, is R een archiefstuk.
  3. De enige manier om archiefstuk A van zijn archiefstatus te ontdoen is door vernietiging of vervreemding. Dit kan niet door te "zeggen" dat het geen archiefstuk meer is (bijvoorbeeld door er een stempel "vervangen" of "werkexemplaar" op te zetten).
  4. Iedere vervanging, vernietiging of vervreemding van A (en R) moet gespecificeerd worden. Als dit niet  gebeurt, heeft de vervanging, vervreemding of vernietiging niet rechtmatig plaatsgevonden.
  5. De vervanging van A door R is pas afgerond als A vernietigd is.
De combinatie van 1 en 2 betekent dat er in dat geval sprake is van twee archiefstukken.  

Stelling 3 zou nog kunnen betekenen dat je A kunt vervreemden als je R gemaakt hebt, maar artikel 7 suggereert dat vernietiging van A het doel is. En vervreemding is niet hetzelfde als vernietiging.
Vandaar stelling 5: je moet A vernietigen als je wil dat R zijn plaats innneemt.

Maar ik ben natuurlijk benieuwd naar jullie tegenwerpingen...

Gerelateerd
Wat doen we met de vervanging?
Een bouwvergunning vervangen
Substitutie, magda?

zaterdag 12 november 2011

Over verdwenen decoraties uit een archief

Hendrik Antoon Lorentz,
in 1916 geschilderd door
Menso Kamerlingh Onnes.
Gisteren stond in de NRC een artikel over het archief van Hendrik Lorentz dat in het bezit is van de KNAW. De krant schreef:
Lorentz is vermoedelijk ook de meest gedecoreerde Nederlandse wetenschapper. Hij won de Nobelprijs, legde de grondslag voor Albert Einsteins speciale relativiteitstheorie en was voorzitter van de Zuiderzeecommissie die de Afsluitdijk voorbereidde. Maar nagenoeg al zijn decoraties zijn weg. Verdwenen uit de kluis in het Trippenhuis van de Koninklijke Nederlandse Akademie van Wetenschappen (KNAW) in Amsterdam.
In de krant wordt Anne Kox geciteerd, die de vermissingen opmerkte in de inventaris die Joeri Meijer eerder dit jaar maakte van het archief van Lorentz.
In die inventaris staat op pagina 4:
De Akademie kreeg na de dood van Lorentz ‐ naast de documenten ‐ ook het beheer over enkele medailles en penningen uit zijn bezit. Uit een lijst met stukken die waren gedeponeerd in een safe bij de Incasso Bank/Amsterdamsche Bank op de Nieuwmarkt, blijkt welke medailles en penningen van Lorentz op 28 september 1956 nog door de KNAW werden beheerd. Deze stukken zijn later overgebracht naar de kluis in het Trippenhuis, de zetel van de KNAW. Helaas zijn een groot aantal van de medailles en penningen in één van de daaropvolgende decennia verloren gegaan. De vermissing van een aantal gouden voorwerpen (waaronder ook een gouden snuifdoos van Jacob van Lennep en een gouden ganzenveer) werd geconstateerd in de jaren tachtig. In plaats van de Lorentz‐medailles trof men een kleine hoeveelheid muntjes aan, afkomstig uit diverse landen. Van de gouden voorwerpen was alleen een gouden ring met gezette steen achtergebleven (deze was in 1957 na afloop van het KNSM congres door de heer M.E. ’t hart gevonden in de toiletkamer). Omdat de inhoud van de kluis al geruime tijd niet was gecontroleerd, bleek het onmogelijk om nog te reconstrueren wanneer de voorwerpen waren verdwenen. De overgebleven penningen uit het bezit van Lorentz zijn opgenomen in de penningencollectie van het Trippenhuis. Dit betreft:
– een zilveren penning uitgegeven ter gelegenheid van het 680‐jarig bestaan van de Universiteit van Parijs (1895); en
– de Copley Medal van de Royal Society te Londen (30 november 1918).
En dan volgt een lijst van dertien gouden en zilveren penningen  en decoraties, die waarschijnlijk als permanent verloren beschouwd moeten worden. Of zoals Robbert Dijkgraaf, de huidige KNAW-president, zegt: „Het ging duidelijk om het goud, waarschijnlijk zijn ze omgesmolten.”


Maar, het lijkt me ook verstandig om die lijst met vermiste penningen te publiceren, zodat bekend wordt dat ze eigenlijk bij het KNAW thuis horen wanneer ze ooit nog eens op de markt verschijnen.


Gerelateerd
Diefstal in het Stadsarchief
De archiefdief documenteert natuurlijk
Archiefpolitie

vrijdag 11 november 2011

PACER: Openbaarheid van de rechtspraak

Gisteren was ik bij onze overburen van Océ voor het seminar van de NVBA over privacywetgeving. Er waren drie lezingen, waarvan er eentje helemaal niet over privacy ging. (Dit was namelijk gewoon een productpresentatie van iemand van Océ over DossierFlow. Blijkbaar heeft het zakenleven nu ook het zaaksgewijs werken ontdekt. Het enige bijzondere in vergelijking met de Corsa's, Verseons ca, dat ik gehoord heb, is dat in DossierFlow een volgende behandelstap geadviseerd wordt op basis van voorgaande vergelijkbare zaken.)
De andere twee presentaties waren interessanter. Peter de Jong, afscheid nemend voorzitter van de NVBA, fileerde in zijn presentatie de informatie die het College Bescherming Persoonsgegevens op zijn eigen website geeft over de toepassing van de Wet Bescherming Persoonsgegevens. Deze is bij lange na niet eenduidig en begrijpelijk, zeker niet al het gaat over medische gegevens of werknemersdossiers.
De andere lezing was van Marc van Lieshout van TNO. Hij behandelde in een krap drie kwartier de meeste aspecten van privacy en dataprotectie in de moderne online wereld. Voor mij weinig nieuws, maar in de "nazit" hebben we nog even een paar onderwerpen besproken die ik hier ook al eens beschreven heb. Zo hebben we het onder andere gehad over het verschil tussen Amerika en de EU. En zo kwamen we op iets dat ik gisteren al even aanstipte: PACER.

In de recente commotie rond Dominique Strauss Kahn werd weer eens duidelijk dat er grote verschillen zijn tussen de manier waarop men in de Verenigde Staten omgaat met verdachten en hoe we dat in Europa doen. Maar het gaat nog wat verder. Mag je in Nederland blij zijn als een uitspraak redelijk snel en geanonimiseerd op rechtspraak.nl wordt gepubliceerd, in de Verenigde Staten worden heel veel documenten gedurende een zaak integraal (dus niet geanonimiseerd) online gezet:
Public Access to Court Electronic Records (PACER) is an electronic public access service that allows users to obtain case and docket information from federal appellate, district and bankruptcy courts, and the PACER Case Locator via the Internet. PACER is provided by the federal Judiciary in keeping with its commitment to providing public access to court information via a centralized service.
Als je geregistreerd bent - wat mij nog niet gelukt is - kun je allerlei documenten raadplegen, waarbij je kunt zoeken op naam, zaaknummer of datumbereik.:
PACER includes case and docket information for all district, bankruptcy, and appellate courts. PACER currently hosts 500 million case file documents. These are available immediately after they have been electronically filed. No other court system provides as rapid access to as much case information.
Ondertussen zijn niet alleen documenten, maar ook integrale audio-opnamen van zaken toegankelijk.
Toegang tot documenten kost $0,08 per pagina, met een maximum prijs van $2,40 (dus documenten van  30 pagina's of meer en audio-opnamen kosten $2,40). De afrekening gaat per kwartaal, maar als je "rekening" in die periode lager is dan $10, hoef je niks te betalen.
De documenten die je gedownload hebt, mag je daarna (her)gebruiken hoe je wil, aangezien het om "public records" gaat.

Dat kunnen we ons hier toch niet voorstellen?
En willen we ons dat hier kunnen voorstellen?

Gerelateerd
Google en privacy: VS vs EU
De archiefdief documenteert natuurlijk alles

Plaatje: Nothing to hide van Markus Hametner

donderdag 10 november 2011

De archiefdief documenteert natuurlijk alles

Eind vorige maand gaf Jason Savedoff toe dat hij samen met Barry Landau honderden waardevolle documenten van verschillende instellingen heeft gestolen. Ik schreef eerder over hun arrestatie. Uit het persbericht dat de FBI naar aanleiding van de voorgeleiding publiceerde blijkt voor een deel hoe Savedoff en Landau te werk gingen.
Ze bereidden hun bezoekjes en diefstallen uitgebreid voor:
Savedoff admitted that he and his co-conspirator prepared lists containing the names of historical figures and other noteworthy individuals, and made notations referencing the value of signatures and documents authored or signed by the listed individuals. Savedoff, under the direction of his co-conspirator, conducted research, including via the internet, to identify collections containing valuable documents, which, when located, were targeted for theft.
Ze verstopten documenten in hun kleding, vooral jasjes die ze daar speciaal voor aangepast hadden:
These techniques included concealing documents inside sports coats and other outerwear which had been modified to contain hidden pockets, as well as distracting museum curators to disguise their actions.
Ze documenteerden heel precies wat ze gestolen hadden:
A checklist was prepared for each stolen document which identified the author and date of the document; the collection from which it was stolen; whether the museum card catalogue had been collected; whether there existed any microfilm or other “finding aid” for the document at the museum; the nature of any markings on the document: and whether any museum markings had been removed from the document.  
En als het mogelijk was namen ze de toegang (het indexkaartje of delen van een inventaris) ook meteen mee.
Naar aanleiding van dit laatste merkt Bonnie Weddle op dat het publiceren van inventarissen op internet aan de ene kant dus dieven wijzer kan maken, zorgt het er tegelijkertijd ook voor dat de inventarissen - die een soort eigendomsbewijs zijn - niet ook gestolen kunnen worden. Dat is ook wat Albert Koevoet hier iets meer dan een jaar geleden zei over het digitaliseren van originelen: je hebt een bewijs dat het van jou is.

In de zaak van Savedoff zal de rechter op 10 februari 2012 de straf bepalen. Hij kan maximaal 5 jaar voor samenzwering en 10 jaar voor diefstal (dus gecombineerd 15 jaar) krijgen.
Landau heeft ondertussen huisarrest en houdt vol dat Savedoff de "mastermind" achter de diefstallen is. Maar dat is zeer onwaarschijnlijk, gezien de gigantische hoeveelheid documenten (zo'n tienduizend) die in zijn appartement terug gevonden zijn. Fysiek is het onmogelijk dat al deze documenten gestolen zijn binnen de 18 maanden dat Landau en Savedoff elkaar kenden.

Gisteren heeft Bonnie trouwens nog enkele documenten uit de rechtzaken integraal online gezet. Ook fascinerend, dat dat zo maar kan.

Gerelateerd
En als je gepakt wordt, gooi je het in de wc
Diefstal in het Stadsarchief

woensdag 9 november 2011

WTF, valse documenten tegen lekken!?

Dit Wired-artikel heb ik echt twee keer moeten lezen voor ik snapte wat het probleem en wat de oplossing was:
Darpa-funded researchers are building a program for “generating and distributing believable misinformation.” The ultimate goal is to plant auto-generated, bogus documents in classified networks and program them to track down intruders’ movements, a military research abstract reveals. “We want to flood adversaries with information that’s bogus, but looks real,” says Salvatore Stolfo, the Columbia University computer science professor leading the project. “This will confound and misdirect them.” (You can make your own fake doc on the research lab’s website, too.) The program aims to scare off uninvited riff-raff as well as minimize insider threats, one of the greatest vulnerabilities in military networks. Fake “classified” documents, when touched, will take a snapshot of the IP address of the intruder and the time it was opened, alerting a systems administrator of the breach.
Hier kun je zelf, na registratie, spelen met documenten met "beacons." Je kunt documenten downloaden en je kunt ook eigen documenten uploaden om te laten markeren.
Er zijn wat technische vragen die je bij deze methode kunt stellen. Ik heb als proef een bonnetje gedownload. Op het moment dat ik dat pdf-bestand open in Acrobat Reader verschijnt onderstaande mededeling:

Hoe onopvallend!
En zou een serieuze hacker zijn ip-adres niet heel degelijk afschermen?

Hopelijk ten overvloede - jullie snappen waarschijnlijk zelf ook wel waarom dit een slecht idee is - toch ook even de andere manco's van dit plan op een rijtje zetten.

Legitieme gebruikers van de documenten zullen toch op enig moment moeten weten of ze te maken hebben met een vervalsing of niet. Hoe kun je anders ooit nog een onderbouwde beslissing nemen en bewijzen dat je die beslissing genomen hebt? Als "het lek" weet wat vals is en wat niet, heb je dus geen biet aan al die dummy-documenten. Die worden dan gewoon niet meegelekt. In het WikiLeaks-verhaal had Manning gewoon toegang tot de documenten die hij downloadde, dus dan zou hij toch ook wel geweten hebben welke documenten "fake" zouden zijn?

Uitgangspunt van de onderzoekers is volgens de hoogleraar die het onderzoek leidt dat:
If a bogus document is actually released online, it would shatter the credibility of the whistleblowing website that published it.
Zou het? Zou het risico op het verspreiden van enkele "valse" documenten echt zo hoog ingeschat worden dat er niets meer gelekt wordt? En zou de bewijslast niet toch eerder bij de overheid liggen, die dan moet aantonen welke documenten wel en welke niet vals zijn?

Het enige "voordeel" voor de overheid lijkt me de mogelijkheid tot ontkenning:
Doordat deze methode nu publiekelijk bekend is, kun je als overheid in de toekomst bij elk lek zeggen: "Ha, maar dat zijn helemaal geen authentieke documenten!" Ook als het wel degelijk om "the real thing" gaat.
Maar het is dan wel de vraag hoe lang mensen andere overheidsdocumenten en overheidsarchieven nog blijven vertrouwen...

Afbeelding: Fish Decoy van Cliff

dinsdag 8 november 2011

Illegale vernietiging bij de SEC

Een paar dagen later dan beloofd...
Afgelopen zomer bleek dat het tussen 1981 en 2010 bij de SEC, de Amerikaanse "beurswaakhond", staand beleid was om dossiers van "voorlopige onderzoeken" direct na sluiting te vernietigen.
Deze onderzoeken, die in SEC-jargon "matters under inquiry" (MUI) heten, zijn de eerste stap in een groter onderzoekstraject. Naar aanleiding van de resultaten wordt er "echt" SEC-onderzoek gestart of er wordt besloten verder niets te doen. Op grond van de federale bewaartermijnen moeten deze dossiers minstens vijfentwintig jaar bewaard blijven, zodat er later, bij nieuwe onderzoeken eventueel nog op terug gegrepen kan worden.
Eerder deze week presenteerde de Inspector General van de SEC zijn onderzoeksrapport naar de onrechtmatige vernietiging. Ik heb de berichtgeving hierover enkel via de Washington Post gevolgd en heb hier de berichten chronologisch bij elkaar gezet.

In de artikelen komen een paar interessante dingen aan bod.

De waarde van concepten
Op het moment dat de bom barst en het NARA navraag doet naar de vernietigingspraktijk, proberen medewerkers van de SEC het geval (uiteraard) te bagataliseren. Uit de concept-versies van de brief die naar NARA gestuurd werd, blijkt dat men eerst van plan was om toe te geven dat de dossiers niet vernietigd hadden mogen worden. In de uiteindelijke versie staat dat 'its enforcement division was “not aware of any specific instances” in which it destroyed records of cases that it deemed unworthy of full-blown investigation.' Aanleiding voor deze wijziging was blijkbaar de angst bij SEC-medewerkers dat het vertellen van de ware toedracht zou kunnen leiden tot "criminal liability for senior SEC officials."
Die "senior officials" zullen het nu wel heel erg spijtig vinden dat die concepten niet ook vernietigd zijn...

"We hebben nog wel iets bewaard"
Een andere uitvlucht van de SEC was dat elementaire informatie nog wel bewaard werd in een aparte database
If the SEC needed the discarded information, much of it could be gathered again, Khuzami said in a letter to Sen. Charles E. Grassley (R-Iowa). In addition, the SEC’s case tracking systems have preserved some information about the closed files, such as the general subject, the dates the files were opened and closed, the parties involved, and the names of the SEC staff members who participated, he said.
Uiteindelijk stelde de Inspector General vast dat er inderdaad wel een database was, maar dat de informatie die daar in bewaard werd onbruikbaar was:
However, the inspector general’s office found only sketchy or unclear information about certain files in which Madoff was listed as a “Related Name,” the report said. For example, the electronic entry for an inquiry closed in 1994 says “Inappropriate for Enforcement Action.”
"Niet alle documenten waren archiefstukken"
 Dit is een redenering die je hier ook steeds vaker hoort: niet alle documenten in een (zaak)dossier zijn archiefstukken. Dit is bijvoorbeeld, tot mijn ongenoegen, ook een van de uitgangspunten in het laatste concept van de Baseline DIV.
De SEC zei het in dit geval als volgt:
Although MUIs fell under the record-keeping schedule, “only certain categories of documents” in those files “are considered the official records of an investigation and are thus subject to the twenty-five year retention requirement,” a draft said. What’s more, the files would “not normally include documents subject to long-term retention.”
In an interview, a National Archives official, Laurence Brewer, expressed skepticism about that argument.
Other than duplicate documents and the like, he said, “offhand, I can’t think of anything that would be disposable.”
Gerelateerd
Onrechtmatige vernietiging: schadeclaim van 5 miljoen dollar
Paper trail