les clouds offrent des services de stockage de … · elles sont conçues pour des débits de...

Post on 15-Sep-2018

212 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Lescloudsoffrentdesservicesdestockagededonnéesàlademande.

Lesfournisseursdeservicesdestockagedanslecloudfacturentnonseulementlecoûtdel’espacedestockagedanslecloudmaiségalementletransfertdesdonnéesentrel’entrepriseetleclouddanslesdeuxsens,ceciparcequelestransfertsdedonnéesmonopolisentdesressourceschezlefournisseur.Plusieurstypesdeservicesdestockagepeuventêtrefournis.

AuniveauSaaS,desapplicationsdédiéesaustockagesontfournies.Enparticulier,desapplicationscommedropboxquipermettentauxutilisateursfinauxdesynchroniserdesrépertoiresdedonnéesaccédésdepuisplusieursmachines.Parexemple,l’utilisateurpeutaccéderàcesdonnéesdepuissonordinateurpersonnelousonsmartphone.OnaégalementdesapplicationsdesauvegardedeBackupdedonnéesdanslecloud.IlyaégalementdesapplicationscommeGoogleDocsquipermettentdepartagerdesdonnéesentreplusieurspersonnesdanslecadred’untravailcollaboratif.Cesapplicationspermettentalorsuneéditioncoopératived’unmêmedocumentavecdesmodificationsdechacunvisiblesentempsréelpartouslesautresmembresdugroupe.Enfinilyaégalementdesapplicationsquipermettentderendrevisiblesdesdonnéescommeparexempledesapplicationsdepartagedephotos.Lesdéveloppeursd’applicationspeuventutiliserlesapplicationsdestockagequejeviensdementionner.Eneffet,toutescesapplicationsoffrentuneinterfacedeprogrammation.

Doncdenombreuxproduitsexistent,commeentémoignentleslogosquiillustrentcetransparent.Lesservicessedifférencientpar:

- latailledel’espacedestockagegratuitfourniauxutilisateurs,- lecoûtmensueldustockageadditionnel,- lalimitemaximalesurlatailledesfichiersquipeuventêtrestockés,- lessystèmesd’exploitationsupportéssurlesPC,- lefaitquecesservicessupportentoupaslessmartphonesetletypedesupportoffertsurles

smartphones.

Lasécuritéestbienentendueunepréoccupationimportantepourlespropriétairesdesdonnées.Certainsservicesdestockageoffrentuneprotectiondesfichiersparmotdepasse,et/ouunchiffrementdesdonnées.

VoyonsmaintenantlesservicesdestockagededonnéesoffertsparlescloudsIaaSinfrastructure.Auniveauinfrastructure,deuxtypesdedonnéessontàconsidérer:

- d’unepartlesimagesdemachinevirtuelle,- d’autrepart,lesdonnéesdesutilisateursquisontmanipuléesparlesmachinesvirtuelles.

Dupointdevuedel’espacedestockage,chaqueserveurdecalculdansleDataCenterdisposed’undisquelocal.Lestockagesurlesdisqueslocauxdesserveursestunstockageéphémèreparnature.Ilestdisponibleletempsdel’exécutiondelamachinevirtuelle.Enoutre,lefournisseurdecloudd’infrastructuresgèredesserveursquisontdédiésaustockagedesdonnéespourcettefois-cidustockagedelonguedurée.Lesdisquesvirtuelsdesmachinesvirtuellespeuventêtrestockéssoitsurlesdisqueslocauxdesserveursdecalcul,soitdansl’espacedestockagepartagé.

Plusieurstypesdestockagededonnéespersistantesexistent,lessystèmesdestockaged’objetsetlespériphériquesdestockagedeblocsdedonnées.Lessystèmesdestockaged’objetssontparexempleleserviceS3offertparAmazon.Cetypedesystèmesdestockageestutilisépourstockerlesimagesdemachinevirtuelleetlesfichiersdesmachinesvirtuelles.Unpériphériquedetypeblocsdedonnéespeutêtreutiliséparlesmachinesvirtuellescommeundisquesurlequelellespeuventinstallerlesystèmedefichiersdeleurchoix.LesystèmeEBSd’Amazonestunexempledecetype-là.Engénéral,lesmachinesvirtuellesutilisentcesystèmedestockagepourrangerlesfichiersoudesbasesdedonnées.UnpetitfocusdoncsurlesdeuxservicesdestockagepersistantsoffertsparAmazon,àsavoirS3etEBS.

DoncEBSestunpériphériquedisqueextensible.Lesdonnéessontrépliquéessurplusieurspériphériquesdemanièreoptionnellepourgarantirdelafiabilité.EtEPSpeututiliserdifférentssupports,soitdesdisquesmagnétiques,soitsurSSD.LeserviceS3quantàluipermetdestockerdesobjets,iloffredelapersistanceetdelahautedisponibilité.AmazonstockelesdonnéesdeS3dansplusieurszonesditesdedisponibilité,c’estàdiredansplusieursDataCentergéographiquementdistants.CeserviceestaccessibleàtraversuneinterfaceWeb.

Dansunclustervirtuel,ilestpossiblededéployerdifférentstypesdesystèmesdefichiersselonlesbesoinsdesapplications.Celapeutêtreunsystèmedefichierslocalcommeext3surLinuxouLFSquiseraaccessibledanslaVMoùilestinstallé.CelapeutêtreaussiunsystèmedefichierdistribuécommeNFS,HDFS,GFSquivapermettredepartagerdesfichiersentreplusieursmachinesvirtuelles.OucelapeutêtreaussiunsystèmedefichiersparallèlescommeCeph,GPFS,pourpermettredesentréessortiesefficaces.Dansuncloudd’infrastructures,lesoptionspourlestockagedesdonnéesdesapplicationsquis’exécutentdanslesmachinesvirtuellessontdoncmultiples.Donclechoixetlaconfigurationdustockageestunetâchearduepourlesutilisateursdeclustersvirtuels.

Unsystèmedefichierdistribué,communémentdéployédanslecloud,estlesystèmeHDFS,ilestnotammentutilisépourl’exécutiond’applicationMAPreduce,commeonleverradanslaséquencesuivante.LaparticularitédusystèmedefichiersHDFSestd’exploiterlesdisqueslocauxprésentssurlesdifférentsnœudsdecalculpoureffectueruntraitementenparallèlesurdegrosvolumesdedonnées.Cesystèmedefichiersgèreautomatiquementlaréplicationdesdonnéessurplusieursdisques.

Àl’heuredubigData,desvolumesdedonnéescroissantssontproduits,lesdonnéessontextrêmementvariéesetlerythmedeproductionpeutêtretrèsrapide.Ilpeuts’agirdedonnéessemiounonstructuréesetbiensouventlesdonnéessontliéesentreelles.

Donccesévolutionsontdonnénaissanceàdenouveauxtypesdebasededonnéesquenousallonsaborderdansladeuxièmepartiedecetteséquence.Lesbasesdedonnéestraditionnellessontfondéessurdesschémasdedonnéesquisontfixesetdéfinisdèslaconceptiondecesbasesdedonnées.CessystèmesdebasededonnéestraditionnelsgarantissentlespropriétésACID(AtomicityConsistencyIsolationDurability):

- Atomicitédesmisesàjourtoutourien,- Cohérencedesdonnéesenprésenced’écrituresconcurrentes,- IntégritéetPersistancedesdonnéesendépitdedéfaillancesoud’attaque.

IlfautsavoirquelamiseenœuvredespropriétésACIDentraînedessurcoûtsimportantsdufaitdesbesoinsdesynchronisation,cequilesrendinadaptéespourbonnombred’applicationsnouvelles.

Danslesannées2000desbasesdedonnéesdenouvellegénérationontvulejour,lesbasesdedonnéesnonstructuréesounotonlySQL: structureévoluantdynamiquement(nonrelationnel).Danscenouveautypedebasededonnées,leschémadesdonnéespeutévolueraufildutemps,parajoutdenouveauxattributs.LesdifférentesbasesdedonnéesetnoSQLfontdiverscompromisentrelestroispropriétésmentionnées.Biensouvent,ellesaffaiblissentlacohérenceauprofitdesdeuxautrespropriétés.

Cesontlesplussimples,ellesgèrentdesindexclés/valeuravecseulementtroistypesd’opérations:larecherchedansl’index,l’ajoutoulasuppressiond’élémentsdansl’index.Ellessontutiliséesparexemplepourlagestiondeprofilsutilisateursoudepréférencesdanslesapplications.

Ellessontunpeuplussophistiquéesquelesprécédentes.Onappelledocumenttouttyped’objetsanspointeur.Cesbasesdedonnéesgèrentdesdocumentsimbriquésdeslistesdesindexsecondaires.Leslignesd’unenregistrementsontdetaillevariableetilestpossibled’ajouterdesattributsdynamiquement.Cetypedebasededonnéesestutilisépourdesapplicationsdanslesquellesplusieurstypesdedonnéessontgérésetpourlesquelleslesdonnéesn’ontpasbesoind’êtremisesàjourdemanièreimmédiate.Celapeutêtrelecasd’applicationsd’analysededonnéeswebentempsréelquicalculentparexemplelenombredepagesvues,lenombredevisiteursdoncilmanipulelesnotionsdepagesetdevisiteurs.

Ellesontlemêmetyped’usagequelesbasesdedonnéesorientéesdocuments.Cependant,ellessontconçuespourdesdébitsdedonnéesplusimportantsetdesgarantiesdecohérenceplusfortes.Ellessontutiliséesparexemplepourlesdonnéesdesitesdecommerceélectronique.Ellesgèrentdegrosvolumesdedonnéesscalairesetsontstructuréesenfamilledecolonnes.Doncilestpossibled’ajouterdescolonnesdynamiquement.Lesdonnéesdecetypedebasededonnéessontautomatiquementpartitionnéeshorizontalementpargroupesdelignesstockéessurdifférentssitesetégalementverticalementparfamilledecolonnesàdesfinsdepassageàl’échelleetd’efficacité.Lepartitionnementpermetd’équilibrerlachargesurplusieurssitesetdemettreenplaceefficacementdelaréplicationdedonnées.

Ellessontutiliséesdansdesapplicationsdetyperéseauxsociaux,desservicesdegéolocalisationetdesmoteursderecommandation.Danscetypedebasededonnées,troisnotionssontgérées:lesnœuds,lesrelationsentrelesnœudsetlespropriétésquivonts’appliquerauxnœudsetauxliensentrelesnœuds.Surl’exemple,legraphereprésentedesacteursdesfilmsetdesréalisateurs,lesacteurssontcaractériséspardespropriétéscommeleurnom,leurdatedenaissance.Lesarcssontégalementétiquetésavecdesmentionstellesque“ajouédans”ou“adirigé”.

Quecesoitlesbasesdedonnéesoulessystèmesdefichiers,ilexistedesoutilsquipermettentdelesdéployerfacilementdanslecloudquecesoitauniveauIaaSouauniveauplateforme.DanslecasdescloudsdetypeIaaS,lessystèmesdefichiersoulesbasesdedonnéessontinstallésetpréconfigurésdansdesimagesdemachinevirtuellequisontmisesàdispositiondesutilisateursdanslesplacesdemarché.Certainsservicesdeplateformepermettentdedéployeretgérerl’élasticitédessystèmesdefichiersetdesbasesdedonnées.Pourreprendrel’exempledelaséquenceprécédentedeConPaas,cetteplateformepermetdedéployerunsystèmedefichiersdistribuésélastiquesXtreemFSetpermetégalementdedéployerlabasededonnéesrelationnelleMySQL,ainsiqu’unebasededonnéesnoSQLorientéeclésvaleursScalarix.Touslessystèmesdestockagequenousvenonsd’évoquertrouventdesapplicationsdanslesvillesintelligentesquigénèrentdesvolumesdedonnéesconsidérablesquisontexploitéesparunemultituded’applicationsauservicedescitoyens.

top related