zaterdag 3 december 2011

Universele toegang tot alle kennis

Brewster Kahle en The Internet Archive (foto Gawker)
De omvang en groei van Archive.org blijft onvoorstelbaar.
Op Long Now geeft Stewart Brand een korte samenvatting van wat Brewster Kahle en kornuiten allemaal voor elkaar hebben gekregen en krijgen:

Boeken
Voor de "Internet bibliotheek" zijn al 3 miljoen boeken gescand en er staan wereldwijd 29 scanrobots die hier iedere dag 1.000 boeken aan toevoegen, "digitized into every handy ebook format, including robot-audio for the blind and dyslexic."
Even modern heavily copyrighted books are being made available for free as lending-library ebooks you can borrow from physical libraries—100,000 such books so far. (Kahle announced that every citizen of California is now eligible to borrow online from the Oakland Library’s “ePort.”)
Muziek
Er zijn wereldwijd tot nu toe blijkbaar tussen de 2 en 3 miljoen "records" gemaakt, maar die zijn juridisch streng bewaakt. Maar, toen Internet Archive de muzikanten onbeperkte en "eeuwige" opslag aanbod, stroomde de muziek naar binnen.
The Archive audio collection has 100,000 concerts so far (including all the Grateful Dead) and a million recordings, with three new bands every day uploading.
Bewegend beeld
Net als liedjes, zijn de 150.000 commercieel geproduceerde films juridisch onaantastbaar, maar daarnaast zijn er nog 2 miljoen andere films, waarvan er nu al 600.000 toegankelijk zijn. En
In the year 2000, without asking anyone’s permission, the Internet Archive started recording 20 channels of TV all day, every day.
Internet
Toen The Internet Archive in 1996 begon, waren er "slechts" 30 miljoen webpagina's. Nu kopieert de Wayback Machine om de twee maanden "iedere" webpagina, waarna ze doorzoekbaar zijn in de database die 150 miljard pagina's bevat en 6 petabyte groot is.
It has 500,000 users a day making 6,000 queries a second.
Bibliotheek van Alexandrië
Het ideaal van Kahle is een verbeterde versie van de Bibliotheek van Alexandrië, die vooral beroemd is omdat hij verbrand is.
To maintain digital archives, they have to be used and loved, with every byte migrated forward into new media evey five years. For backup, the whole Internet Archive is mirrored at the new Bibliotheca Alexadrina in Egypt and in Amsterdam. (“So our earthquake zone archive is backed up in the turbulent Mideast and a flood zone. I won’t sleep well until there are five or six backup sites.”)
Over de organisatorische duurzaamheid stelt Kahle tenslotte, en ik vermoed dat hij hierbij onder andere op Google doelt, dat non-profit organisaties aantoonbaar langer bestaan dan bedrijven.
It might be it’s because they have softer edges, he surmised, or that they’re free of the grow-or-die demands of commercial competition. Whatever the cause, they are proliferating.
Wat zijn wij dan toch allemaal nog maar krabbelaars...

Aanvulling, zaterdag 3 december 2011, 13:16
Hier kun je een podcast van de hele lezing  van Kahle, waar dit een samenvatting van is, downloaden.

Gerelateerd
The Internet Archive gaat boeken bewaren
Het Nederlandsch Archievenblad, dat is science-fiction

3 opmerkingen:

  1. Inderdaad indrukwekkend wat het IA doet - met een budget van niet meer dan 10-15 miljoen dollar, en goed dat je daar nog eens aandacht aan besteedt.
    Maar: de duurzaamheid wordt hier iets te rooskleurig voorgesteld. Kahle zelf zegt niet dat er "mirrors" zijn in Amsterdam en Alexandrie - dat maakt Brand ervan, maar het dekt de lading niet.
    In Alexandrie staat een kopie van het web- en filmarchief - status 2002. Dat is een statische kopie van een (steeds kleiner wordend) deel van de collectie en wordt niet geupdatet - daarvoor is geen geld. Maar het was een hele vooruitgang ten opzichte van "geen" backup, dus het IA nam de uitnodiging om dit te doen maar al te graag aan.
    Wat er precies in Amsterdam staat en wat in San Francisco, wordt niet helemaal duidelijk, maar om "mirrors" gaat het nog lang niet. Tot nu toe zijn slechts "delen van de collectie" gebackupt, zegt Brewster zelf.
    Dit alles doet niets af aan Brewsters prestatie, maar een mens zou willen dat er wat geld beschikbaar kwam om deze uiterst waardevolle collectie echt duurzaam te behandelen!

    BeantwoordenVerwijderen
  2. Dank je voor de nuanceringen Inge. Ik heb de hele lezing van Kahle nog niet geluisterd, maar ga dat nu zeker doen.

    BeantwoordenVerwijderen
  3. Om het verhaal helemaal precies te maken: de informatie die ik je gaf komt niet alleen uit de lezing die je citeerde, maar ook uit andere lezingen van Kahle die ik bijwoonde, o.a. bij Beeld en Geluid (lancering Prestocentre dit voorjaar, http://digitaalduurzaam.blogspot.com/2011/03/screening-future-2-het-verslag.html) en eerder bij IIPC 2009 (http://digitaalduurzaam.blogspot.com/2009/10/iipc-1-hoe-zorgen-we-voor-duurzame.html).

    BeantwoordenVerwijderen