Me juba teame, et suur hadronite põrkaja (LHC) on suurim, kõige kallim füüsikakatse, mida inimkond on kunagi läbi viinud. Relativistlike osakeste kokkupõrge varem kujuteldamatu energiaga (kümnendi lõpuks kuni 14 TeV märgini) tekitab miljoneid osakesi (teadaolevaid ja veel avastamata), mida tuleb jälgida ja mida iseloomustavad tohutud osakeste detektorid. See ajalooline eksperiment nõuab tohutut andmete kogumist ja säilitamist, kirjutades ümber andmete töötlemise reeglid. Iga viie sekundi järel tekitavad LHC-i kokkupõrked DVD-väärtuses andmeid, mis on ühe gigabaidi sekundis andmetootmise kiirus. Vaadates seda perspektiivi, võib keskmine väga hea ühendusega majapidamiskompuuter olla võimeline andmeid alla laadima kiirusega üks või kaks megabaiti sekundis (kui teil väga veab! Mul on 500 kilovatti sekundis). Nii on LHC insenerid välja töötanud uut tüüpi andmetöötlusmeetodi, mida saab salvestada ja levitada petabaadid (miljonit gigabaiti) andmeid LHC kaastöötajatele kogu maailmas (ilma et saaksite allalaadimist oodates vananema ja halliks).
1990. aastal tegi Euroopa Tuumauuringute Organisatsioon (CERN) revolutsiooni selle kohta, kuidas me elame. Eelmisel aastal kirjutas CERNi füüsik Tim Berners-Lee elektroonilise teabehalduse ettepaneku. Ta esitas idee, et teavet saaks hõlpsalt Internetis üle anda, kasutades nn hüperteksti. Aja möödudes lõi Berners-Lee ja ka CERNi süsteemiinsener Robert Cailliau kokku ühe teabevõrgu, mis aitas CERNi teadlastel teha koostööd ja jagada teavet oma personaalarvutitest, ilma et oleks vaja seda salvestada tülikasse salvestusseadmesse. Hüperteksti abil saidid kasutajad veebilehtede abil teksti sirvida ja seda jagada, kasutades hüperlingid. Seejärel lõi Berners-Lee brauseritoimetaja ja mõistis peagi, et seda uut suhtlusvormi võib jagada suur hulk inimesi. 1990. aasta maiks nimetasid CERNi teadlased seda uut koostöövõrgustikku Veeb. Tegelikult vastutas CERN maailma esimese veebisaidi eest: http://info.cern.ch/ ning varajase näite selle saidi väljanägemise kohta leiate veebisaidi World Wide Web Consortium kaudu.
Seega pole CERN Interneti kaudu andmete haldamine võõras, kuid uhiuus LHC vajab erikohtlemist. Nagu rõhutas Georgia tehnikainstituudi kõrgjõudlusega andmetöötluse tegevdirektor David Bader, on interneti praegune ribalaius tohutu kitsaskoht, muutes muud andmevahetuse vormid soovitavamaks. “Kui ma vaatan LHC-d ja seda, mida see tulevikuks teeb, on ainus asi, mida veeb pole suutnud teha, fenomenaalse hulga andmete haldamine, ”Ütles ta, mis tähendab, et suuri andmestikke on lihtsam salvestada terabaidilistesse kõvaketastesse ja seejärel need postituse kaastöötajatele saata. Ehkki CERN on käsitlenud andmete ühiskasutust laadi Internetis, koormavad LHC genereeritavad andmed hõlpsalt praegu saadaolevaid väikeseid ribalaiusi.
Seetõttu loodi LHC andmetöötlusvõrk. Võrgustik tegeleb LHC ulatusliku andmestiku tootmisega astmeliselt, esimene (Tase 0) asub kohapeal CERNis Šveitsi Genfi lähedal. Tier 0 koosneb tohutust paralleelsest arvutivõrgust, mis sisaldab 100 000 täiustatud protsessorit, mis on loodud LHC poolt välja pumbatud lähteandmete (binaarse koodi 1 ja 0) viivitamatuks säilitamiseks ja haldamiseks. Siinkohal väärib märkimist, et andurid ei tuvasta kõiki tahkete osakeste kokkupõrkeid, vaid väga väike osa on võimalik jäädvustada. Ehkki tuvastada võib vaid suhteliselt vähe osakesi, on see siiski tohutu väljund.
Määramistasand 0 haldab osa andmeid väljastatavast materjalist, lõhkates seda spetsiaalsete 10 gigabitise sekundis kiudoptiliste liinide kaudu 11-ni 1. määramistasand saite kogu Põhja-Ameerikas, Aasias ja Euroopas. See võimaldab kaastöötajatel nagu Relativistic Heavy Ion Collider (RHIC) New Yorgis Brookhaveni riiklikus laboris analüüsida ALICE eksperimendi andmeid, võrrelda LHC pliiioonide kokkupõrke tulemusi nende enda raskete ioonide kokkupõrke tulemustega.
Tier 1 rahvusvahelistest arvutitest pakitakse andmekogumid kokku ja saadetakse 140-le 2. määramistasand arvutivõrgud, mis asuvad ülikoolides, laborites ja eraettevõtetes üle kogu maailma. Just sel hetkel on teadlastel juurdepääs andmekogudele, et teisendada töötlemata binaarsest koodist kasutatavaks teabeks osakeste energiate ja trajektooride kohta.
Tier-süsteem on hea ja hea, kuid see ei töötaks ilma ülitõhusa tüüpi tarkvarata, mida nimetatakse vahevara. Andmetele juurdepääsu proovimisel võib kasutaja soovida teavet, mis jaguneb eri serverites erinevas vormingus olevate andmete petabaites. Avatud lähtekoodiga vahetarkvara platvorm nimega Globus on tohutu vastutus koguda vajalikku teavet sujuvalt, justkui see teave juba uurija arvutis istub.
Just seda astmesüsteemi, kiire ühenduse ja leidliku tarkvara kombinatsiooni saaks laiendada ka LHC projektist kaugemale. Maailmas, kus kõik muutub nõudluse järgi, võib selline tehnoloogia teha Interneti-ühenduse läbipaistev lõppkasutajale. Seal oleks kohene juurdepääs kõigele, alates planeedi teisel küljel tehtud katsete andmetest kuni kõrglahutusega filmide vaatamiseni, ilma et peaksite alla laadimise edenemisriba ootama. Sarnaselt Berners-Lee HTML-i leiutisega võib LHC Computing Grid revolutsiooniliselt muuta seda, kuidas me Internetti kasutame.
Allikad: Scientific American, CERN