vrijdag 9 mei 2014

Hoe het Britse Nationale Archief social media "archiveert"

Sinds gisteren archiveert The National Archives 
tweets and You Tube videos published by UK central government departments from their official Twitter and YouTube social media platforms.
En op het weblog van het archief legt Tom Storrar uit wat dit betekent.
Government now uses a wide variety of social media platforms but we have limited this project to Twitter and YouTube as, although archiving them presented unique technical challenges, we were confident that it was feasible. In addition, Twitter and YouTube are heavily used across central government and contain a large amount of information that may not be accessible elsewhere. For comparison, Facebook is far too complex to archive effectively at scale while limiting to government accounts. Flickr is very similar. Now we have developed scalable solutions for Twitter and YouTube we will capture target accounts according to a regular schedule, and ensure this content remains available even after the original accounts have gone.
Omdat ik vind dat er een paar rare passages in staan, staat in de titel van dit stukje archiveert  tussen aanhalingstekens.

Twitter
Het archief gebruikt voor de overheidstweets de twitter-api om in een keer een grote hoeveelheid tweets te kunnen downloaden. Maar:
Having a way to download a more comprehensive set of tweets and provide access to them did not mean that we should preserve and give access to them. We can only do this with government-produced content so tweets sent from non-government accounts that form part of a conversation on Twitter haven’t been preserved.
Retweets made by a government account will appear, by default, in the API. However, as retweets are Tweets from different accounts to the account holders we are permitted to capture, we could not justify including them in our archive. We wrote a script which specifically excluded retweets from the archived code.
Ik vind dit raar.
Allereerst denk ik dat als een overheidsorganisatie een tweet van iemand anders "retweet" dat volgens mij ook een tweet van die overheidsorganisatie is, die gearchiveerd zou moeten worden.
Ten tweede begrijp ik uit deze passage dat van discussies enkel de berichten van de overheidsorganisatie worden bewaard. Dat levert dan toch een onbegrijpelijke serie tweets op? Ik weet het, je kunt digitaal niet altijd met analoog en social media niet altijd met asocial media vergelijken, maar een door de overheid ontvangen briefje of e-mail maakt toch ook deel uit van het overheidsarchief?
Ik vermoed dat hier iets met de Auteurswet speelt, maar dat maakt het niet minder raar.

Iets vergelijkbaars geldt voor het "oplossen" van ingekorte links:
The challenge here was to allow the user to see the intended destination for a shortened link without archiving content from websites that are not within scope for our web archiving activity.
We wrote an application that expands the shortlinks and determines which final URLs are from government websites and which aren’t. For those that do go to government websites and are captured, we provide normal access to the archived webpage.
Dus alleen overheidssites worden bewaard. Ik vind het wel mooi dat direct naar het webarchief verwezen wordt, maar het kan hierbij de vraag zijn of de pagina waar de link naar verwijst inhoudelijk nog wel dezelfde is als de pagina uit het webarchief.

Op deze pagina kun je zien van welke overheidsorganisaties het archief de twitter-accounts als test heeft gearchiveerd. De komende tijd zullen deze automatisch aangevuld worden.

Wat verder opvalt, is dat het archief voorlopig alleen voor Youtube en Twitter gekozen heeft, onder andere omdat Facebook "is far too complex to archive effectively at scale while limiting to government accounts." In Antwerpen lukt dat best.

Gerelateerd
Mijn eerste Duitse presentatie tijdens Offene Archive 2.1 #archive20
Stop eens een Facebook-pagina in je archief

Geen opmerkingen:

Een reactie posten