woensdag 7 december 2011

URL-verkorters bewaren

Een jaar of twee geleden schreef ik op Archief 2.0 een stukje over het archiveren van tweets en de problemen die het gebruik van URL-verkorters (zoals bit.ly,  tiny.cc of tr.im - o nee, die laatste toch niet) oplevert. Deze week ontdekte ik dat The Internet Archive daar ook een voorziening voor heeft: 301 works
301Works.org is an independent service for archiving URL mappings. The goal of the service is to provide protection for every day users of short URL services by providing transparency and permanence of their mappings. Shortened URL archives are in accordance with 301Works.org membership terms. Items contained in the archives are not publicly accessible at this time.
Het principe is heel simpel:

  1. Participating companies will regularly back up their URL mappings (short and long URLs pairs) to the service provided by the Internet Archive, using one of the supported formats. "Regularly" shall be interpreted as at least once per month. The current support format is a .csv text file, with the following fields: 1/ long url, 2/ short URL, 3/ (optional) click count, and 4/ (optional) date of creation.
  2. In the case of closure of the URL shortening service, a participating company will agree to transfer technical control of the shortening service domain so that 301Works can perform the redirection of shortened URLs. Note: This does not mean that the company will transfer ownership of the domain in such a case. Likewise, a closing company will agree to allow 301Works to publish the mappings so that users can remap any shortened URLs they may be using.
(Ik wilde deze blog beĆ«indigen met de vraag "Heb jij je tabellen al aangeleverd Bob?", omdat ik Bob Coret nog wel eens zie verwijzen naar via.coret.org. Ik dacht dat hij een eigen shortener had gemaakt en gebruikt, maar bij nader inzien gebruikt hij de bit.ly-api, geloof ik.)

Gerelateerd
Universele toegang tot alle kennis

Plaatje: Bit.ly, a simple url shortener van twitter.com/a3munier

6 opmerkingen:

  1. Ingmar,

    Ik maak op mijn websites wel gebruik van de bit.ly API maar de via.coret.org short URL  is een feature van Bitly Pro (die tegenwoordig voor iedereen beschikbaar is) genaamd Custom Short Domain (https://bitly.com/pro/help#shortdomain). Een kwestie van instelling in Bitly en je eigen DNS. 

    Op 301works.org lees in trouwens: "Bit.ly is not currently uploading data". 

    Bob

    BeantwoordenVerwijderen
  2. Ah, maar op 
    http://blog.bitly.com/post/240893054/announcing-the-launch-of-301-works lees ik dat ze het wel van plan zijn!

    BeantwoordenVerwijderen
  3. Ik geloof dat ik wel een beetje snap hoe dat Custom Short Domain werkt. De vraag is nu alleen nog: wordt ook ergens de relatie tussen de via.coret.org en bit.ly vastgelegd? 
    Ik heb gezien dat 't stukje na de "/" identiek is, maar hoe weet ik dat jij bit.ly gebruikt en niet een andere verkorter die dezelfde mogelijkheden biedt?

    BeantwoordenVerwijderen
  4. Een "feature" van bit.ly is dat er ook statistieken van de verkorte URL worden bijgehouden. Deze kun je inzien door achter de korte url een + (plus) te typen. Dit werkt dus ook bij via.coret.org. Voorbeeld: de statistieken van de link naar deze blogposting: 
    http://via.coret.org/s1qH7b+ (alwaar je direct de bitly omgeving ziet)

    BeantwoordenVerwijderen
  5. Het technische antwoord omtrent de relatie tussen via.coret.org en bit.ly > zie de DNS entry bijv. via http://centralops.net/co/DomainDossier.aspx?addr=via.coret.org&dom_dns=true (waar je dus ziet dat via.coret.org verwijst naar cname.bitly.com)

    BeantwoordenVerwijderen
  6. Dat had ik al geprobeerd en zo wist ik dat het bit.ly's waren. Maar mijn vraag is de "duurzaamheidsvraag:" 
    Stel Bit.ly gaat uit de lucht, hoe weet ik dan nog dat http://via.coret.org/s1qH7b eigenlijk http://bit.ly/s1qH7b is, die eigenlijk http://ingmarbladertenschrijft.blogspot.com/2011/12/url-verkorters-bewaren.html is? 
    Of zou Bit.ly ook die url-tabellen allemaal inleveren bij The Internet Archive?

    BeantwoordenVerwijderen