dinsdag 15 november 2011

Metadata in je plaatjes

Naar aanleiding van een tweet van Edwin las ik dit weekend de discussie op Archief 2.0 over watermerken in afbeeldingen nog eens helemaal. Een paar dingen vallen me nu op.
Een van de argumenten die gebruikt wordt voor het plaatsen van watermerken, is dat daarmee de metadata van de afbeelding te achterhalen zijn. Want:
Wij, archivarissen, besteden veel tijd en geld aan het beschrijven van het beeldmateriaal en vinden het daarom belangrijk dat de herkomst gewaarborgd blijft.
Bob heeft dit argument al grotendeels onderuit gehaald (want een watermerk bevat nauwelijks relevante metadata), maar ik zit ook nog even met de betekenis van het citaat hierboven.
Ja, archivarissen besteden veel tijd en geld (als het goed is bijna al hun tijd en geld) aan het beschrijven van archiefstukken. Maar die beschrijvingen gelden vooral voor de archiefstukken die zij in beheer hebben. Ik vraag me af of archivarissen ook verantwoordelijk zijn voor de metadata van de kopieën van archiefstukken die zij verstrekken aan derden. Naar analogie met een opmerking van Christian: als we een kopietje van een briefje uit een dossier maken, voegen we daar toch ook niet de hele beschrijving uit de inventaris aan toe?

Embedden
Iets anders wat opvalt, is dat de hoop gevestigd wordt op embedden, om op die manier de "link" naar de beheerder te bewaren. Hierbij gaat het om het embedden van het plaatje vanaf de servers van de archiefdienst. Bijvoorbeeld zoals ik eerder een plaatje vanuit Gahetna.nl in een blog over geweren geplaatst heb.
(Overigens en terzijde: het lijkt dus alsof je de foto's vanuit Gahetna.nl niet kunt downloaden, maar in de embed-code staat wel een rechtstreekse url naar het plaatje, waardoor dat bestand dus wel apart opgeslagen kan worden.)

Maar er is natuurlijk nog een andere manier van embedden...
De foto's hierboven en hieronder zijn afkomstig van het BHIC. Je kunt deze foto niet meteen embedden, maar wel downloaden. De foto hierboven is de versie zoals ik die gedownload heb, de foto hieronder heb ik ietwat gemanipuleerd.
Dat zie je niet aan de foto, maar aan de eigenschappen van het bestand. Om dit te zien zijn een paar extra stappen nodig...
Download alletwee de foto's en geef ze een afwijkende naam, open ze in bijvoorbeeld Picasa en bekijk de "Eigenschappen" (alt+enter). Bij de bovenste foto zie je dit:

Maar, bij de onderste foto zie je dit:

In de onderste zeven velden zie je dezelfde beschrijvingsgegevens als bij het BHIC op de website. Ik heb die velden op zondagavond met behulp van PhotoMe een beetje in het wilde weg ingevuld (ik heb ook nog ergens een url toegevoegd, maar die zie ik nu nergens meer terug), dus allerlei gegevens staan er dubbel in. Maar, met wat meer overleg moet het lukken om hier logische afspraken over te maken.

Dus, als we die metadata zo relevant vinden en als we het belangrijk vinden dat duidelijk blijft wat de bron van het plaatje is, is dit embedden dan niet een veel elegantere manier dan een lelijk watermerk?

Overigens, deze methode hoeft natuurlijk niet beperkt te blijven tot foto's, maar kan toegepast worden bij ieder digitaal archiefstuk dat beschikbaar gesteld wordt.

Bronnen en inspiratie
Het bovenstaande heb ik niet zelf verzonnen en is ook helemaal niet nieuw.
Ik moest er aan denken door een blog van de Library of Congres over het toevoegen van beschrijvingen aan foto's. Daarnaast eist een van de Brabantse archiefdiensten iets vergelijkbaar bij de vervanging van bouwvergunningen. Daar moeten in de "scanbestanden" ook allerlei context-data opgenomen worden. (Ik heb niet kunnen achterhalen of ze dit ook al doen bij de foto's uit hun beeldbank.)
En tenslotte is dit ook ongeveer wat David Bearman meer dan vijftien jaar geleden zei, toen hij het had over "metadata encapsulated objects" en de eis dat data-objecten die als records dienen "self documenting" zouden moeten zijn.

25 opmerkingen:

  1. Het opslaan van meta-informatie bij afbeeldingen, net als ook in Word en PDF document, lijkt mij erg nuttig! Meta-data raamwerken als XMP (http://nl.wikipedia.org/wiki/XMP) werken volgens mij alleen bij JPEG en TIF, maar dat lijkt mij wel genoeg. Volgende stap is nog wel om een standaard af te spreken voor op te nemen meta-info...

    Ik wil nog wel een punt herhalen dat ik ook in mijn betoog op Archief2.0 wilde maken: je moet het als archief instelling heel makkelijk maken om een bronvermelding te maken! Een lijst met alle meta-info in of onder de afbeelding is wel een begin, maar liever een knip-en-plak-klare bronvermelding! En ook, als je embedden mogelijk maakt, toon dan niet alleen de afbeelding (met link naar afbeelding op archiefsite, uiteraard een pURL) maar plaats ook hier de bronvermelding (dus klikken op de embed knop levert op de site waar het wordt toegepast een afbeelding en bronvermelding). Dit soort knip-en-plak-klare bronvermeldingen kunnen zo op basis van beschikbare meta-info gemaakt worden, hebben we vast ook wel een standaard voor...

    Vraag me nu wel ineens af: in de kleinere afbeelding (een "afgeleid werk"?) die wordt gebruikt voor embedding, zit daarin dezelfde meta-info als in het origineel?

    BeantwoordenVerwijderen
  2. Helemaal eens met je embed-punt Bob, die gegevens zouden gewoon meegenomen moeten worden.  (Vergelijk het embedden van een Vimeo-filmpje met Youtube. Bij die eerste worden standaard een omschrijving en de "auteur" in een beschrijving meegenomen.)
    Mij lijkt dat je in alle afbeeldingen die je beschikbaar stelt, die meta-info opneemt, zodat van alle varianten de bron en betekenis duidelijk blijft.

    BeantwoordenVerwijderen
  3. Hier hoeven we niet lang over te discussiëren: dit is immers stúkken eleganter dan een watermerk. Maar nogmaals, ik geloof niet dat achter dat watermerk de gedachte zit dat we bezoekers willen 'helpen' met hun bronvermelding, zoals tijdens de discussie op Archief 2.0 beweerd. Het is gewoon een manier om te voorkomen dat je plaatjes zomaar elders zouden worden gebruikt - wie weet wat er voor enge dingen mee worden gedaan (zonder te betalen nog wel!)

    Ik moet bijna denken aan die stempels die archiefdiensten vroeger op hun charters en zo zetten... alhoewel de vergelijking deels mank gaat hoor.

    Trouwens is de link naar de foto op de BHIC-site niet meer geldig - wij hebben nog geen permanente url's, omdat we nog een oudere versie van de software gebruiken. Lang verhaal...

    BeantwoordenVerwijderen
  4. Dat van die link is wel bijzonder inderdaad. Blijkbaar wordt die random toegekend of zo, want ik krijg geen foutmelding, maar de haven in Ravenstein. Even nadenken over een elegante formulering hiervoor.
    Inhoudelijk heb je helemaal gelijk hoor, dat watermerk lijkt vooral bedoeld om op de een of andere manier controle uit te blijven oefenen. Dat laat onverlet dat je metadata natuurlijk wel op deze manier zou kunnen (of moeten) toevoegen.

    BeantwoordenVerwijderen
  5. Laat ik daar nou vooral in geïnteresseerd zijn... Kan iemand me daar wat meer over vertellen? Ik ben geen fototechneut, maar bedenken welke metadata je zou willen toevoegen gaat me beter af. Als er, naast de (unieke) url, al één ding is dat daarbij als standaard gebruikt kan worden is het de ISIL-code van de instelling waar de afbeelding vandaan komt. De gouden regel in al dit soort zaken is volgens mij: wat je op internet zet kan worden gebruikt én misbruikt (screenshots leveren in alle gevallen al hele aardige plaatjes op, als je ze wil hergebruiken op internet). Als je dat niet accepteert, zet het dan niet op internet.

    BeantwoordenVerwijderen
  6. Er zijn verschillende soorten metadata: technische, administratieve en inhoudelijke. De laatste zijn het meest interessant. Daarvoor bestaat een heel bekende standaard: Dublin Core (begin hier: http://nl.wikipedia.org/wiki/Dublin_Core). Vooral bedoeld voor het metadateren - in gewoon Nederlands: beschrijven - van webpagina's en webelementen. Met name in de bibliotheekwereld wordt hiervan gebruik gemaakt. DC is heel goed te gebruiken voor het beschrijven van foto's. Je kunt er ook de 'rechten' in kwijt, de auteur en de naam van degene die het plaatje heeft gepubliceerd.
    Maar met een standaard ben je er nog niet. Deze moet worden geïmplementeerd in je eigen softwareomgeving. En dat is voor veel instellingen een probleem. De complexiteit van de systemen, de bureaucratie en de kosten zijn dan een hinderpaal. Er zijn maar weinigen die dit zelf voor elkaar kunnen blijven.

    BeantwoordenVerwijderen
  7. Dank voor je toelichten Henny. Uiteraard moet er het een en ander geregeld worden, maar als ik voor watermerken in mijn jpg's kan zorgen, kan ik ook voor metadata zorgen. Ik zeg niet dat het makkelijk is, maar ik heb ook niet de indruk dat er tot nu toe al veel moeite voor gedaan is. Mij lijkt dat Pictura en DeRee en cornuiten dit best zouden moeten kunnen realiseren. Maar dan moeten "wij" er wel om vragen.

    BeantwoordenVerwijderen
  8. Ingmar,
    Eerlijk gezegd hoop ik toch wel dat archiefmedewerkers bij een gevraagde kopie van een archiefstuk ten minste het archief, de inventaris en het inventarisnummer vermelden. Zo heb ik het in ieder geval wel geleerd bij die 2 archiefdiensten waar ik ook dienstverleningswerkzaamheden uitvoerde.Overigens geven je handelingen met de metadata van de foto aan hoe gemakkelijk er gemuteerd kan worden. En dat zou een tegen-argument kunnen zijn. Een watermerk muteren is vermoedelijk ingewikkelder. Of eenvoudiger waarneembaar.

    Ik ben geen verklaard voor- of tegenstander van watermerken of elegantie en ik denk dat er situaties zijn waarin het een handige oplossing is en situaties waarin het niet nodig of zelfs onhandig is.

    BeantwoordenVerwijderen
  9. Ha, eerlijk gezegd heb ik zitten wachten op de muteerbaarheidstegenwerping ;-)
    Hoezo zou dat een probleem zijn? De reden om die metadata toe te voegen is geen "defensieve", het is niet bedoeld om plaatjes te beschermen. Het argument van Leo voor het watermerk was dat de "kijker" dan het plaatje kon traceren en dat is waar deze toevoeging vooral voor dient. Niets meer en niets minder. Als iemand zich de moeite wil nemen om dit te wijzigen: soit. De archiefdienst is niet verantwoordelijk voor de metadata van "kopieën" die niet onder zijn controle vallen.Het toevoegen van metadata op deze manier is verder natuurlijk ook geen beletsel voor het aanbrengen van een watermerk. Dat kan altijd nog.
    En aan de andere kant: de reden waarom ze bijvoorbeeld in Antwerpen alle digitale archiefstukken inpakken in een xml-wrapper met alle relevante metadata, is dat je daardoor op ieder moment op basis van enkel de ingepakte archiefstukken een nieuwe toegang kunt opstellen.  Dat zou al reden genoeg moeten zijn om bij de digitale bestanden die je als archiefdienst in beheer hebt de metadata te embedden.

    Wat dat toevoegen van inventarisnummers aan kopieën betreft: daaruit blijkt maar weer eens dat ik nooit bij een archiefdienst gewerkt heb ;-)

    BeantwoordenVerwijderen
  10. Gegevens meegeven aan kopieën van gescande archiefstukken, waaronder foto's, wordt bij het Nationaal Archief standaard gedaan. Deze gegevens zijn opgenomen in de bestandsnaam. Het NA hanteert, tot verdriet van de scanbedrijven, betekenisvolle bestandsnamen.
    Die zijn zo opgebouwd: ISIL-code_archiefcode_inventarisnummer_volgnummer-scan.extensie.
    Dus: NL-HaNA_1.01.02_3456_019.jpg.
    Hier hebben we dan de 19e scan van inventarisnummer 3456 uit archief Staten-Generaal 1576-1796 (met archiefinventaris 1.01.02) in het Nationaal Archief.

    BeantwoordenVerwijderen
  11. Interessant Henny. 
    Hoe werkt dat bij deze foto, die hier vandaan komt?

    BeantwoordenVerwijderen
  12. Dat werkt dus bij ons niet :-(  Zitten we aan de beheerskant dergelijke info toe te voegen, wordt het aan de publiekskant niet zichtbaar. Het is duidelijk dat hier nog wat verbeterd moet worden. Maar ik ben bang dat de permalink belangrijker wordt gevonden dan een betekenisvolle bestandsnaam. Moeten we misschien in de header van het plaatje gaan meegeven. Probleem daarbij is dat de meeste browsers die info niet tonen: daarvoor heb je weer afzonderlijke tools nodig.

    BeantwoordenVerwijderen
  13. Leo noemt 6 redenen en bijvoorbeeld nummer 6 (bescherming van de belangen van andere rechthebbenden, i.c. de eigenaren) is wel degelijk defensief. En de archiefdienst kan zeker moeite doen om te voorkomen dat anderen zich eenvoudig, maar onrechtmatig als eigenaar voordoen o.i.d. Met zo'n watermerk geef je 'duurzamer' aan waar de rechten (en de context) na te gaan zijn (is).
    Ik zeg niet dat het zaligmakend is. Geen idee ook, hoe gemakkelijk watermerken onzichtbaar te verwijderen zijn. Maar dat metadata alleen bedoeld is voor inhoudelijke beschrijving, bestrijd ik.

    BeantwoordenVerwijderen
  14. Henny van Schie 
    Persoonlijk zie ik het nut niet van een betekenisvolle bestandsnaam, zolang er een permalink is naar het bestand in zijn context. Wat is jullie reden om dat in te voeren?

    BeantwoordenVerwijderen
  15. Volgens mij ben je nu iets aan het bestrijden wat ik helemaal niet gezegd heb. 
    Mijn punt is, dat een watermerk enkel defensief is: dit is van mij en daar mag jij niet aankomen. En daar kunnen best goede redenen voor zijn hoor.Dat de context erdoor aangegeven wordt, lijkt me zwaar overdreven. Het enige dat aangegeven wordt, is wie de foto ooit online gezet heeft. En enkel met een met http://www.tineye.com/ vergelijkbare zoekmachine kun je dan snel achterhalen om welke specifieke foto het gaat.
    Volgens mij zijn deze metadata vooral informatief: dit is wat je ziet. En als je dat extra wil beschermen door middel van een watermerk, aan 't plaatje toegevoegde licentie of url, dan kan dat.

    BeantwoordenVerwijderen
  16. Ik probeer net bij de Interneringskaarten te kijken hoe dat er dan uitziet, maar dat werkt niet. 
    Ik kan een kaart niet embedden (en dus geen "downloadbare" jpg vinden). 
    Maar ook de permalinks vertonen kuren. Zie bijvoorbeeld deze: http://proxy.handle.net/10648/8fbef651-68e2-4170-b13a-4ec1764c568cIk zal dit ook nog even apart melden.

    BeantwoordenVerwijderen
  17. Hmm, die proxylink hoort inderdaad gewoon te werken. Ik zal er morgen naar kijken!


    Het aanbieden van embed-codes doen we alleen bij onze fotocollectie en kaartencollectie. Bij documenten zoals de Japanse interneringskaarten bieden we die mogelijkheid niet aan. Wel interessant om het daar nog eens over te hebben trouwens.

    BeantwoordenVerwijderen
  18. Een van de redenen om voor permalinks te kiezen boven betekenisvolle namen is dat toegangs- en inventarisnummers nog wel eens veranderen. Denk aan het samenvoegen van de verschillende inventarissen van de Staten-Generaal. En instellingen kunnen ook van naam veranderen en zelfs als ze dat niet doen kunnen ze alsnog een andere domeinnaam krijgen (gahetNA!). Bij die permalinks kunnen we altijd zorgen dat ze naar de huidige plek wijzen waar de betreffende resource beschikbaar is, ongeacht gebruikte software, metadata of naamgeving van websites.  

    BeantwoordenVerwijderen
  19. Hmm, ik heb @timmietovenaar aka Meneer de Haan ondertussen al een officiële e-mail gestuurd.
    Mij lijkt embedden voor alle bestanden interessant en relevant.

    BeantwoordenVerwijderen
  20. Betekenisvolle bestandsnamen zijn van belang voor het beheer. Heb je al eens in een map met documenten gezocht, zonder een betekenisvole naam? En wat dacht je als beheerder te kunnen doen als je de mededeling krijgt na het activeren van deze link: http://proxy.handle.net/10648/c1ebe3ec-bb06-4f84-8149-c95aa21e526e?

    BeantwoordenVerwijderen
  21. Er wordt aangegeven (mits dat in het watermerk staat) wáár je de context en de rechten kunt nagaan. Dus bijvoorbeeld of de metadata bij de foto ook de metadata zijn die de originele publicist er aan verbonden had.
    En inderdaad geeft het aan wie het online gezet heeft. Dat is precies de bedoeling. Dan heb je tineye.com niet nodig.

    BeantwoordenVerwijderen
  22. Ach ja, er werkt bij een archiefdienst altijd wel iemand met een  "fotografisch" geheugen, die een foto enkel op basis van het "plaatje" kan terugvinden in een bak met tienduizenden foto's. (Zoals gezegd, ik heb nooit bij een archiefdienst gewerkt en ken du niet alle ins & outs daarvan....)
    Tenzij je dus inderdaad een enorm watermerk maakt, waar je al die metadata aan toevoegt. En dat is in heel veel gevallen lelijk en onnodig.

    BeantwoordenVerwijderen
  23. Henny, ik mag hopen dat er een beheersdatabase is met een directe koppeling tussen de logische beschrijving en de fysieke lokatie, anders dan een Windows mappenstructuur? Juist bij digitale bestanden is dat zinvol, lijkt me.

    Dit is een steeds terugkomende discussie tussen archivarissen (en vermoedelijk ook in andere beroepsgroepen): betekenisvolle bestandsnamen vs zinvol databasebeheer. Ook bij digitale bestanden geldt dat logische en fysieke ordening verschillende zaken zijn, misschien juist wel in nog extremere mate, dan bij papier.

    Zoals Yvette zegt, de logische en beschrijvende metadata wil nog wel eens veranderen. Als de bestandsnaam de logische metadata bevat, dan zal er dus iedere keer digitaal 'omgenummerd' moeten worden om de bestandsnaam logisch terugvindbaar te houden.  Dat lijkt me tijdverspilling en daarnaast de kans op 'verlies' door naamconversiefouten vergroten.

    Toegangs- en inventarisnummers zijn logische metadata die als een 'label' aan het digitale object hangen. De bestandsnaam is ook een label. Als dat betekenisloos is, hoeft het dus niet mee te wijzigen als de andere labels wijzigen. Dat lijkt mij een stuk duurzamer.

    Ook bij een Error - not found melding is dit geen probleem. Immers, de betekenisloze bestandsnaam zit in de permalink. Daarmee is (in ieder geval aan de beheerkant) uit te zoeken welk bestand bedoeld wordt.

    BeantwoordenVerwijderen
  24. We zijn nu bij het HCO in Zwolle bezig, nog niet operationeel, om adminstratieve en inhoudelijke metadata te koppelen aan de afbeelding. Hierbij gaan we gebruik maken van een aantal velden uit de IPTC. we hanteren de naamgeving voor het bestand volgens de naamgeving die Henny van Schie aangeeft, maar koppelen deze data ook in de IPTC + een aantal andere kenmerken als eigendom, etc. (vergelijkbaar aan DC maar dan niet in de beschrijving in de database die gekoppeld is aan de afbeelding).  Hierbij speelt eveneens bij mij - op persoonlijke titel - de gedachte dat de afbeeldingen zonder een beeldbankapplicatie dan makkelijker op een andere manier te ontsluiten zijn (in de zin van de gebruiker kan zelf bepalen, aan de hand van de metadata uit de IPTC, hoe hij/zij zelf een 'beeldbank'  o.i.d. wil opbouwen). Bij het downloaden van een afbeelding uit de beeldbank worden de IPTC gegevens meegekopieerd en niet zo snel aangepast als een bestandsnaam (een gebruiker zal een naam toekennen die voor hem/haar herkenbaar is). En als er later gevraagd wordt om een betere kwaliteit van de afbeelding is a.d.h.v. van de IPTC metadata de afbeelding snel terug te vinden.
    (Trouwens ik ben van mening als er auteursrechten in het geding zijn, dan moet je de afbeelding ofwel niet plaatsen of blijven voorzien van een watermerk.)

    BeantwoordenVerwijderen
  25. Heel mooi Bert!
     Zou je me een seintje willen geven als dit bij jullie operationeel is?

    BeantwoordenVerwijderen