Opslag van informatie in ‘de cloud’ wint sterk aan populariteit. Maar hoe werken deze diensten nu écht? Onderzoekers van het Centrum voor Telematica en Informatietechnologie (CTIT) van de UT maakten voor het eerst een uitgebreide analyse van de populaire dienst Dropbox die nu al 100 miljoen gebruikers heeft. Een van de tekortkomingen die de performance sterk beïnvloedt, is de fysieke afstand tot de servers van Dropbox. De onderzoekers presenteren hun bevindingen op de grote Internet Measurement Conference (IMC2012) in Boston.
Het voordeel van cloud services is de gebruiker overduidelijk: overal toegang tot je data, op pc, laptop, tablet of mobiele telefoon. Daar staat tegenover dat er geen systeembeheerder meer is die je kunt aanspreken en die ‘aan de knoppen’ kan draaien als de data op een gegeven moment niet verschijnt. Onderzoekers van de groep Design and Analysis of Communication Systems (DACS) van het CTIT hebben, samen met collega’s van de Politecnico di Torino, voor het eerst, met gedetailleerde metingen, gekeken naar de performance van Dropbox, op dit moment de meest populaire cloud opslagservice. Zij hebben bijvoorbeeld gekeken naar hoe de uitwisseling werkt, op welke manier en wáár de informatie wordt opgeslagen.
Hashing
Voor de opslag van informatie gebruikt Dropbox servers van Amazon, aan de westkust van de Verenigde Staten. De administratieve functies, zoals ‘hashing’, het in stukjes hakken en rangschikken van de data, gebeurt op eigen servers. Herkent Dropbox aan hashes dat een bestand of een deel daarvan al eerder is opgeslagen, dan wordt het niet voor een tweede keer verstuurd. Ook bij andere cloud services wordt op deze manier de noodzakelijke uitwisseling van data beperkt. Een voorwaarde om efficiënt met hashes te kunnen werken, is dat de gebruiker de data niet moet versleutelen. Als de gebruiker dit toch doet, dan wordt de performance van Dropbox opeens veel slechter.
Waar de gebruiker zich ook niet van bewust is, is de fysieke afstand tot de servers waarop de data is opgeslagen. Amazon heeft weliswaar wereldwijd servers, maar Dropbox gebruikt alleen die aan de westkust van de VS. Dit kan, in combinatie met de hashing operatie, leiden tot een flinke daling in performance. Een gebruiker die eraan gewend is dat zijn data direct beschikbaar is, zal langer moeten wachten. .
Het paper ‘Inside dropbox: understanding personal cloud storage services’ door Idilio Drago (UT), Marco Mellia (Politecnico di Torino), Maurizio Munafò (Politecnico di Torino), Anna Sperotto (UT) Ramin Sadre (UT) en Aiko Pras (UT) wordt op 16 november gepresenteerd tijdens de Internet Measurement Conference in Boston. Het paper kan op verzoek toegestuurd worden.