Fujitsu Laboratories(富士通研究所)開發新技術

自動化解決分散式儲存系統性能問題

減輕熱門數據項目70%存取集中性 穩定ICT服務操作


香港,201287 Fujitsu Laboratories(富士通研究所)今天宣布開發新技術,為分散式儲存系統之熱門數據項目的密集存取情況,自動化解決存取時間緩延的問題。

分散式儲存系統將多重伺服器集結於單一儲存器之中。增加伺服器數量可以提高儲存的容量和性能,使這種系統適用於日益增長的數據儲存量。此外,在多重伺服器中同步儲存複製的數據,可以攏高數據可靠度及存取性能。可是,當存取某一儲存數據急劇上升時,便會提高伺服器的負荷,可能會大大增加用戶存取的時間。

Fujitsu Laboratories已經研發出一種新技術,可以即時檢測熱門數據項目,並自動增加其複製量以減輕伺服器負載。現時雖然可以人手操作,但會使存取時間變慢。這項嶄新技術應用於分散式對象儲存(1),並於互聯網上的存取測試中證明可以減輕約70%的集中程度,使存取時間的進展提高十倍或以上。


此技術可穩定ICT系統操作中難以掌握的存取模式。

有關此項新技術的細節於8月1日(星期三)在日本鳥取縣的「平行式、分散式和協作處理(SWoPP2012鳥取)」夏季聯合研討會上發佈。

背景

隨著智能手機和感應器的普及,數據的儲存量和分析量持續迅速增長,帶來了新的商業價值。分散式儲存常用於儲存龐大數據,尤其在多重硬盤、固態硬盤和其他儲存機制組合成單一儲存。增加更多的伺服器可以提高儲存的容量和性能。此外,在多重伺服器中同時儲存複製的數據,可以提高數據的可靠性。(圖1)


1:分散式儲存

技術問題

在分散式儲存系統中,熱門的數據往往被集中存取,令系統表現與伺服器數目失去關連性。舉例說,在新聞網站上的一單熱門消息,往往會被網民不斷讀取,亦只會加重單一伺服器的負荷。就算是增加伺服器數量,也未能解決整體效能下降的問題。(圖2)

2集中存取熱門數據,令系統表現下降

關於新開發的技術


Fujitsu Laboratories已開發一套名為「適應等級複製」(Adaptive Replication Degree)技術,能自動偵測被集中讀取的數據,並複製至不同的伺服器,以分流系統存取。這項科技可以高速偵察及解決系統被過量讀取、減少存取時間緩延,確保系統穩定表現。甚至可以穩定ICT系統中難以預計的存取模式。「適應等級複製」不需要手動設置,亦能實現自動處理密集存取偵測,以及改變複製數據的數量。

有關「適應等級複製」(Adaptive Replication Degree)技術的詳細資料:

1. 以少量記憶體資源,迅速偵測急劇提升的熱門數據,致大量被過量讀取的數據項目

為了偵測特發的密集數據存取,Fujitsu Laboratories開發一套只需佔用少量記憶體的「熱門估算機器」(Popularity-estimation engine),就能推算出數據被讀取的模式。(圖3)在新開發的方法下,只需少量記憶體即可記錄指定資料的數據存取。當非指定的數據被讀取時,系統將會記錄為「較少讀取」;而當被讀取的次數不斷增加,系統就能準確地預測「熱門數據」所在。


另一方面,如果用戶降低指定資料的數據存取基數,就會令系統增加計算最近讀取數據的次數,偵察當中更明顯的存取變化,判斷哪些為「熱門」數據。

2. 自動優化數據複製的數量

為了解決複製數據數量波動的問題,Fujitsu Laboratories已研究出一項新技術以周期性計算數據存取集中性,並分析資料如何被大量讀取(圖4)。當偵察到被大量讀取的數據項目,系統就會自動增加複製數據的數量。此項技術存在兩項優點—指出當前過度讀取的,以及預測下一次負荷的出現;另一方面,該技術亦能偵察數據周期內的存取集中性。當數據被讀取的次數增加,系統就會複製更多「副本」,在網絡數據流量激增時,提升被讀取的比例。

3:「熱門估算機器」(Popularity-estimation engine

4:數據存取梯度分析機制(Access gradient analysis mechanism

成果

這項新技術使用64台伺服器針對現實生活的娛樂項目進行測試(2),根據一位著名歌星(圖5,圖6)在互聯網上的熱門話題故事所導致的龐大數據流量為背景。研究人員每小時對每台伺服器儲存頻率的變化進行檢測,並採用現有的方法,集中存取只包含相關數據的伺服器,發現存取的頻率增加約2.3倍。然而,採用新技術,存取頻率的增加率下降到以前水平的70%,證明新技術有效減輕負載情況。

5:使用舊方法測試每台伺服器在存取集中時的頻率變化

6:使用新方法測試每台伺服器在存取集中時的頻率變化

另一個測試使用了16台伺服器,從用戶的角度檢視存取所花的時間。圖7顯示所有數據被集中存取的平均時間和熱門數據被集中存取的平均時間。對比以往的方法,新技術使全部數據的存取時間在正常存取下變得平均。縱觀所有數據的平均存取時間,舊方法使集中存取的時間較正常存取的時間高約4倍,而新的技術只有約1.2倍。至於熱門數據方面,舊方法使存取時間增加約15倍,而新技術只花約1.4倍的時間。

7:針對不同的數據範疇以及流量情況,進行新舊方法對照

未來計劃

Fujitsu Laboratories將繼續測試並改進這項新技術的性能,目標在2013財政年度應用於產品與服務並推出市場。





術語和註釋
    1 分散式對象儲存:
    將數據及其元數據視為單一邏輯單位並以分佈形式處理的儲存方式

– 完 –


關於 Fujitsu(富士通)集團

Fujitsu(富士通)是世界領先的面向全球市場提供行業解決方案的 ICT 綜合服務供應商。Fujitsu 擁有大約 17 萬名員工,遍佈全球 100 多個國家,Fujitsu 把世界各地的系統服務專家、高度可靠的運算通訊產品和先進的微電子技術結合起來,給客戶提供更多附加價值。富士通集團總部設在東京(東京證券交易所上市代碼:6702),截至 2012 年 3 月 31 日財政年度結束時報告的合併收益為 4.5 兆日元(540 億美元)。更多相關訊息,請瀏覽:www.fujitsu.com

關於Fujitsu Laboratories

Fujitsu Laboratories Limited(富士通研究所)為Fujitsu Limited(富士通株式會社)的全資附屬公司,成立於1968年,是世界頂尖的研究中心之一。Fujitsu Laboratories Limited的環球實驗室網絡遍佈日本、中國、美國和歐洲等地,積極從事廣泛的基礎和應用研究,涵蓋下一代服務、電腦伺服器、網絡、電子裝置及先進物料等範疇。如欲獲取更多資料,請瀏覽:http://jp.fujitsu.com/labs/en/

關於Fujitsu香港

Fujitsu香港是首屈一指的資訊及通訊科技方案和服務供應商,為客戶提供優質可靠及符合環保原則的產品及服務,為他們創造價值。憑藉五十年在業界的豐富經驗,加上是全球資訊科技與電訊基建專家Fujitsu集團的一分子,Fujitsu香港一直透過不斷創新和精益求精的技術,靈活回應每一位元客戶的獨特需求。此外,對於在中國和亞太區內外尋求業務發展機會的企業而言,Fujitsu香港也擔當著「樞紐和橋樑」的角色,務求與客戶建立長遠的合作夥伴關係。我們在本港的主要客戶包括香港特別行政區政府、國泰航空、電訊盈科、凱基證券、中信證券國際、現代貨箱碼頭、八達通及萬華媒體集團等。查詢更多資料,請瀏覽:http://hk.fujitsu.com

在此提及的所有其他公司或產品均為其各自擁有者的商標或註冊商標。此新聞稿的資料在發布時為準確,資料會有機會更新,但不會作另行通知。








Arlo Pro 網絡攝錄鏡頭 - 防水、內置電池、無線
詳情請點擊:http://www.anlander.com


此文章首發於 TechRitual;標題:Fujitsu Laboratories(富士通研究所)開發新技術 自動化解決分散式儲存系統性能問題;內容贊助:NETGEAR orbi,Mesh WiFi 子母機設計打通村屋