RZECZ O ... dodatek do gazety Rzeczpospolita z 19 października 2004 r.

Grid komputerowy

Nowe potrzeby, nowe możliwości

Fizyka jako jedna z pierwszych korzysta z najnowszych osiągnięć techniki, ale też stawia jej nowe wymagania. Eksperymenty przy akceleratorze LHC będą szukać niesłychanie rzadkich zjawisk, wymagających "przesiania" ogromnej ilości informacji - prawdopodobieństwo pojawienia się niektórych procesów wynosi jak 1 do 10 000 000 000 000!

To już nie poszukiwanie igły w stogu siana, a prawdziwej kropli w morzu - szanse przeszukania tak ogromnej liczby danych mają tylko elektronika i komputery. Tylko skąd wziąć potrzebną moc obliczeniową i pamięć? I jak udostępnić te dane wszystkim zainteresowanym?

Problem ten przez wiele lat pozostawał nierozwiązany. Ale w ostatnich latach procesory i pamięci komputerowe, a co ważniejsze sieci komputerowe stają się coraz szybsze, sprawniejsze i... tańsze! A jeśli istnieje sprawna sieć, to nie ma znaczenia, gdzie rozmieszczone są elementy komputerowe, gdyż będziemy mogli przesyłać do nich dane czy programy, wykonywać obliczenia oraz otrzymywać wyniki. Ta koncepcja jest prosta, jednak realizacja światowego gridu, w którym partnerzy wzajemnie udostępniają sobie zasoby komputerowe, w którym sprawnie i bezpiecznie wykonywane są potrzebne obliczenia, nie jest sprawą prostą zarówno pod względem technicznym, jak i organizacyjnym.

Podstawy takich systemów opracowano w połowie lat 90. w Stanach Zjednoczonych - były to systemy Condor i Globus. Systemy gridowe zaczęły się pojawiać w Europie kilka lat później, a jednym z projektów był DataGrid, stworzony z myślą o opracowaniu danych fizyki, biologii i obserwacji Ziemi - projekt ten wykorzystał podstawowe elementy systemu Globus, a dodatkowo stworzył oprogramowanie pozwalające na wykonywanie obliczeń dla fizyki w rozproszonym systemie komputerowym oraz sprawdził jego pracę w takich warunkach. Głównymi partnerami tego projektu były instytuty Francji, Wielkiej Brytanii i Włoch, a kierowniczą role odegrał CERN. Pokrewnym projektem jest CrossGrid, w którym uczestniczą instytucje z 11 krajów, w tym z: Grecji, Hiszpanii, Niemiec i Polski (koordynatorem jest ACK Cyfronet AGH) kontynuuje on prace rozpoczęte przez DataGrid, ale i rozszerza wykorzystanie gridu na aplikacje medyczne i związane ze środowiskiem (przewidywanie pogody, powodzi i skażeń). Obydwa wymienione projekty były dofinansowane przez Unię Europejską.

Oprogramowanie stworzone przez DataGrid oraz infrastruktura pozwoliły na uruchomienie światowego gridu dla fizyki: "LCG-LHC Computing Grid" (http://lcg.web.cern.ch/LCG/) - miało to miejsce we wrześniu 2003 r. Pierwsza instalacja skupiała 14 ośrodków z Europy, Ameryki Północnej i Azji, w tym i krakowski klaster kilkudziesięciu procesorów Intel z oprogramowaniem Linux; podobne systemy gridowe działają w USA (Grid3) i w krajach skandynawskich (NorduGrid). W ubiegłych miesiącach system ten został dopracowany i obecnie skupia 7700 procesorów rozmieszczonych w 73 ośrodkach; zadania są sterowane i monitorowane centralnie.

MICHAŁ TURAŁA, IFJ PAN W KRAKOWIE