2007年5月31日 星期四

格網︰打破個人電腦運算的界線《科學人》雜誌

格網︰打破個人電腦運算的界線

人類花費了數千年的心力,致力打破生產與消費之間的連結,最後造就了農業、量產技術與電力配送。我們的現代世界因此具備了分工、經濟規模與新奇科技等特 色。而我,也才能坐在咖啡廳裡,一邊啜飲義式濃縮咖啡,一邊在筆記型電腦上寫這篇文章,而完全不用考慮我正在消耗的水、咖啡、電力與無線網路頻寬,究竟來 自何方?

這些資源的唾手可得,正好具體展現了虛擬化的概念。對電腦科學家來說,虛擬化指的是:把有用的功能隱藏在界面之後,以掩蓋住功能運作方式的細節。舉例來 說,咖啡廳裡的咖啡師傅打開水龍頭時,就好像是從一個無底的水桶引出水來。當我把筆記型電腦的插頭插入牆上的插座時,狀況也是相同的。既然插頭所連結的巨 大電力網是看不見的,誰會知道電力是從哪裡來,又是如何產生的呢?

不過,運算本身卻沒有半點虛擬的成份。我的筆記型電腦、家用電腦,甚至是複雜的企業資料中心,大半是獨立系統,執行儲存在本機上的軟體程式。如果每個家庭或企業都必須自備發電廠、圖書館、印刷機與貯水池,我們必然無法接受;那麼,為什麼電腦要是例外?

這種不甚完美的狀況,刺激了電腦科學家,他們開始去找尋更有效率的替代方案。既然數位網路變得愈來愈快,為什麼不把分散在各地的配件動態組裝成「電腦」? 如此一來,使用者無需顧慮地點,就可從任何適宜的供應商取得資源,包括處理能力、儲存系統、數據及軟體。換句話說,我們為什麼不把一般的運算服務虛擬化? 這類的運算「格網」可以和電力網一樣普遍,而且一樣有用。

格網業務

一個普遍的運算格網所能造福的對象,可能包括電子商務企業。這類企業可依據需求變化,調整資訊及運算系統,同時把系統連結到合夥公司、供應商及消費者,以 擴大服務範圍。試想有一家專辦探險旅遊的旅行社,提供了潛水地點的虛擬實境探險服務。當一名消費者開始瀏覽虛擬的墨西哥科玆美海域(圖左)時,這家公司就 必須進入資料庫、運用軟體取得相關的地理資訊、把資料變成立體圖像、加入適當的商業資訊(即圖中間的多個連結點),然後再把潛水現場攝影機取得的即時影像 (圖右)整合進去。沒有一家旅行社負擔得起獨自執行這些功能的費用,但有了格網技術,就可從多家供應商取得必要的資源。由於這些供應商各自提供服務給多位 客戶,因此能達到良好的經濟規模。

格 網系統也可能造福更專門的領域。在醫學領域裡,如果我的醫師能存取遠端的電腦與資料庫,就能把我的X光片拿來與其他上百萬病患做比較,或許能因此提早發現 惡疾(如右圖最右邊的專家,與最左邊的醫師與病人,便能透過國家級的數位疾病影像資料庫進行諮詢、分析與交叉比對)。另外,生化學家也能藉由格網系統,把 篩選一萬種藥物的時間,從一年縮減為一小時;土木工程師只要數分鐘就能完成抗震橋樑設計的測試,而不必再耗上數個月。

全 球虛擬格網運算的概念,是今日網際網路的自然延伸。網際網路讓溝通虛擬化了;任何人、任何裝置,不管身在何處或者是採用何種途徑,都可以連結上其他的人與 裝置。這樣的結果導致各種創新的功能快速出現,比如電子郵件、全球資訊網,對等網路(peer-to-peer)應用--包括KazaA這類的檔案共享系 統,以及SETI@home、FightAIDS@home與「天花研究格網」等簡單的分散式運算架構。對正在研發格網的我們來說,目標是把運算及資訊虛 擬化,以便任何人或裝置都能提供軟體服務給其他人或裝置。另外,同樣重要的一點是,讓使用端能夠安全可靠地取得此類的各式服務。

我 之所以對格網運算感興趣,是因為我很想知道,如何以運算工具來提升人類的智力。1990年代初期,我在美國能源部的阿崗國家實驗室進行科學運算工具方面的 研究。當時高速網路正好興起,顯然,我們如果能夠整合網路上的數位資源與活動,就可以改變科學研究的過程。舉例來說,實驗器材可藉此連結上遠端的電腦,進 行即時的數據分析。分散在各地的眾多資料庫也能相互結合,讓研究人員搜尋彼此間有趣的相關性。

因此,在1994年,我決定把研究重心轉移到分散式運算。我與阿崗實驗室的圖埃奇(Steven Tuecke),及當時於加州理工學院擔任研究員的凱塞爾曼(Carl Kesselman,現為南加大資訊科學研究所格網科技中心主任)合作,成立一個軟體系統的開發計畫,希望能促成全球規模的科學合作。我們為這項工作取了一個有點偉大的名稱,叫做「全球計畫」(Globus Project)。

分 散式運算完全不算新點子:今天格網系統中的許多基本概念,甚至在網際網路出現以前,就已經存在了。譬如,回到1960年代中期,「分時處理作業系統」之父 柯巴托(Fernando Corbato)就把當時革命性的「多工資訊運算系統」,形容為一種「工具式運算資源」。銀行與航空產業採用複雜的分散式系統,也已有數十載的歷史。不 過,我們是奀q不同的角度出發,以科學研究社群的需求來看待這個問題。在我們的經驗中,科學研究的需求一向極高,而且算不上有秩序可言,這也是強大的創新 動力來源。因此,電腦科學家柏納李(Tim Berners-Lee),會受到一起工作的高能物理學家所啟發,而發明出「全球資訊網」(WWW)這種可分享資訊的通用系統,就似乎不是一種偶然了。

在 我們的研究裡,我們發現科學社群需要某些技術,好讓分散在各研究單位的合作團體(我們稱為「虛擬組織」),能透過某種可控制且管理良好的途徑,分享彼此的 資源。這就好比從不同的球隊中選出職業足球員組成國家代表隊,然後一起接受訓練好參加世界盃足球賽一樣。這種科學虛擬組織跨越了傳統的研究單位界線,當然 也會在組織及政策上製造出許多問題。當科學虛擬組織的成員展開合作時,特別會需要以可控制的方式分享資訊、電腦、儲存空間與軟體,不過他們卻不像足球員那 樣穿著相同的制服,所用的語言、所遵守的規則也可能不盡相同,甚至可能不會出現在同一場比賽當中!【意猶未盡嗎?欲閱讀完整全文,請參閱2003年5月號 《科學人》雜誌「格網︰打破運算的界線」一文。】


【延伸閱讀】

◎台灣的「國家高速網路與計算中心」配合推動六年國發計畫的基礎建設,提出「高品質學術研究網路」與「台灣知識格網」建置計畫。國網中心初期推動的旗艦型 格網應用計畫包括長期生態觀測格網(福山植物園)、慢性病與氣喘格網、超級視頻格網、洪水預報與防洪減災格網等。《科學人》特邀國網中心計算組組長林芳邦 博士撰寫〈下一代的網際網路〉一文,詳見2003年5月號《科學人》雜誌。

◎國際上重要的格網計劃︰
生物醫學資訊學研究網,美國國家衛生研究院贊助,為生物醫學數據的整合與分析。

能源部科學格網,美國能源部科學局贊助,連結能源部科學實驗室的各項資源與應用程式。

地球系統格網,美國能源部科學局贊助,分析大型的氣候模型數據組。

歐洲太陽觀測站格網,歐盟贊助,整合歐洲各太陽資料中心的研究。

歐盟數據格網,歐盟贊助,發展高能物理學、環境科學及生物資訊學等應用程式。

格網實驗室,歐盟贊助,發展格網科技及應用程式。

格網物理學網路,美國國家科學基金會贊助,為大規模物理實驗的資料分析。

資訊力格網,美國航太總署,支援航太科學研究。

我的格網,英國電子科學計畫,做為生物資訊學應用的工作台。

國家核熔合格網,美國能源部科學局贊助,支援核熔合研究運算。

國家研究格網策進會方案,日本教育部贊助,支援日本國家研究格網計畫。

國家虛擬觀測站,美國國家科學基金會贊助,整合與分析天文資料。

地震工程模擬網路,美國國家科學基金會,支援地震工程研究。

粒子物理學數據格網,美國能源部科學局贊助,支援高能物理與核子物理實驗的數據分析。

生物格網,新加坡政府贊助,支援生物資訊學研究。

萬億格網,美國國家科學基金會贊助,為連結四大科學資源中心的高速基礎建設。

世界格網,美國能源部與國家科學基金會及歐盟贊助,提供全球基礎建設給擁有大量數據的科學研究。
作者福斯特教授的網頁有許多相關資料與連結,值得參考。另外他也曾與另幾位科學家提出格網運算的構想與架構,可參考The Physiology of the Grid: An Open Grid Services Architecture for Distributed Systems Integration一文。

*文章由《科學人》雜誌提供

沒有留言: