Posts tonen met het label e-discovery. Alle posts tonen
Posts tonen met het label e-discovery. Alle posts tonen

vrijdag 6 april 2012

Google Vault is geen Google records management

Techcrunch schreef vorige week:
Today, Google is debuting a new archiving, records management and e-discovery solution for Google Apps for businesses called Vault.
Het eerste wat ik dacht was: "Daar gaan we dan..." en ik moest denken aan de lezing van Steve Bailey van ongeveer anderhalf jaar geleden: In whose hands does the future of digital archiving lie?
Gisteren en vandaag heb ik een beetje rond gekeken op de Vault-pagina's van Google, maar ik geloof dat TechCrunch niet precies weet wat records management inhoudt. Google Vault heeft wel elementen die ook bij records management (en archivering) horen, maar cruciale elementen ontbreken.
Blijkbaar kun je in Vault bewaartermijnen gebaseerd op inhoud, labels en metadata toekennen aan e-mailberichten en "on-the-record chatsessions". Maar dit lijkt erg rudimentair, want beperkt tot een zoekterm, datum, afzender en ontvanger.
Vault lijkt vooral bedoeld om er voor te zorgen dat kleine ondernemingen beter aan de de steeds vaker voorkomende e-discovery kunnen voldoen. Zo is de "legal hold" ook ingebouwd, waardoor je alle e-mail van of naar een of meer users opzij zetten en van vernietiging uitzonderen.
Je kunt in Vault de berichten organiseren in Dingen (Google noemt dit Matters, hoewel je dat met allerlei woorden kunt vertalen - zaken, aangelegenheden, affaires - kies ik nu even voor Dingen).
In Google Apps Vault, a matter is a container for all of the data related to a specific topic, such as a litigation case or investigation. A matter includes:
  • Any saved search queries
  • A list of accounts with data on litigation hold
  • A list of the accounts that can access the matter
  • Any export sets for the matter
  • An audit trail for the matter
En je kunt die Dingen exporteren uit de Apps-omgeving in het MBOX-formaat.
Zoeken en vinden lijken - uiteraard - vooral gebaseerd op full-text search en over de beperkingen daarvan schreef ik afgelopen dinsdag al.
Maar als je dit legt naast de eisen uit bijvoorbeeld MoReq2010, NEN 2082 of de ICA Requirements (nu nog in concept, definitieve versie wordt deze zomer gepresenteerd), dan ontbreken er nog heel wat functionaliteiten. Daarmee is Vault dus nog geen bedreiging voor de "dedicated" EDRMS-producenten.

Maar...
Op het moment dat Google Vault uitgebreid wordt over de hele Google Apps-for-businesssuite (dus inclusief Calendar, Docs, Sites etc) en er wat intelligentere ordeningsmogelijkheden aan toegevoegd worden, komen ze een heel eind. Vooral omdat dan heel veel types documentaire neerslag in één omgeving "gevangen" kunnen worden en er geen sprake meer is van aparte 'archiefsilo's.'

Gerelateerd
Waarom full-text-search niet zaligmakend is
De toekomst van het archief ligt bij Google?

Met dank aan Chris Bellekom voor de attendering:

dinsdag 3 april 2012

Waarom full-text-search niet zaligmakend is

Ik had het al een tijdje niet meer gehoord of gelezen, maar deze week was het weer raak: "Waarom hebben we metadata en ordening nodig, als we slimme zoekmachines hebben?"
Nou hierom... Uit een onderzoek van Blair & Maron bleek enkele jaren geleden dat advocaten met behulp van een zoekmachine uit een collectie van 40.000 documenten, slechts 20% van de relevante documenten vonden. Voor het gemak citeer ik dat onderzoek hier tweedehands (pdf, p.24). Het gaat om een onderzoek naar een ongeluk op een metrostation.
In the legal case in question, one concern of the lawyers was an accident that had occurred and was an object of litigation. The lawyers wanted all the reports, correspondence, memoranda, and minutes of meetings that discussed this accident. Formal queries were constructed that contained the word ‘accident’ along with the names of the [city] where it occurred. In the search for unretrieved relevant documents, the experimenters later found that the accident was not always referred to as an ‘accident,’ but as an ‘event,’ ‘incident,’ ‘situation,’ ‘problem,’ or ‘difficulty,’ often without mentioning the relevant proper name – the name of the city in which it occurred. The manner in which an individual referred to the accident was frequently dependent on his or her point of view. Those who discussed the event in a critical or accusatory way referred to it quite directly – as an ‘accident.’ Those who were personally involved in the event, and perhaps culpable, tended to refer to it euphemistically as, inter alia, an ‘unfortunate situation,’ or a ‘difficulty.’ Sometimes the accident was referred to obliquely as ‘the subject of your last letter,’ ‘what happened last week was...,’ or, as in the opening lines of the minutes of a meeting discussing the issue, ‘Mr. A: We all know why we’re here....’ [the words ‘accident’ and the name of the city were not used at any time in the meeting either]. Sometimes relevant documents dealt with the problem by mentioning only the technical aspects of why the accident occurred, but neither the accident itself no[r] the people or place involved. Finally, much relevant information discussed [contributing factors in] the situation prior to the accident and, naturally, contained no reference to the accident itself.
En dan blijven typefouten of slechte OCR nog buiten beschouwing!

Gerelateerd
Hoeveel is veel


Plaatje: The Droids we're googling for van Stéfan

donderdag 2 juni 2011

Hoeveel is veel?


Al meer dan een jaar oud, dus waarschijnlijk toch al achterhaald, maar de getallen blijven indrukwekkend. Het toekomstbeeld is een beetje dystopisch, maar dat is niet erg.
Lees vooral ook de disclaimer aan het eind.
De muziek is trouwens bagger, dus zet het geluid maar uit.

Gerelateerd
Infopocalypse, kent u dat?

Via Labyrinth