jizzjizz在线观看|国产精品亚洲а∨天堂2021|色综合精品|亚洲成年人免费观看,欧久久av一区二区,浪潮ar麻豆97,亚洲欧美一

您當前的位置是:  首頁 > 新聞 > 國際 >
 首頁 > 新聞 > 國際 >

亞馬遜35PB數據存儲上云經驗首度大公開

2018-12-19 15:50:23   作者:   來源:CTI論壇   評論:0  點擊:


  Amazon數據庫搬遷主要負責人親自傳授從Oracle數據存儲搬上云的第一手經驗,更總結這次搬遷學到的最重要10件事
  Amazon首度公開過去電商平臺采用多年的線上交易與數據存儲服務架構圖
(還未全面改用AWS數據存儲前)。(圖片來源/AWS)
  從這個架構圖來看,不只數據存儲是采用Oracle RAC數據庫架構,在它上方,還有提供3個針對營運、探查與BIM數據設計的專用數據存儲或數據庫,里面用也都是Oracle, 再透過DB Link方式相連,連各種交易資料存放的OLTP數據庫,也都有部分使用到Oracle產品。
  「這是一個高達35PB的超大型數據存儲遷移的挑戰(zhàn)。」Amazon.com大數據技術資深經理Thomas Park在今年AWS re:Invent一場專談DBFreedom的黑板開講(Chalk Talk)上,對著臺下聽眾分享Amazon數據庫上云經驗時首度公開揭露這項數據。
  Amazon在11月1日正式關閉電商平臺使用多年的Oracle數據存儲系統(tǒng),改搬到自家AWS云端數據存儲Redshift上,當時這個消息一出,科技圈譁然,成了熱議話題。也讓全球云端龍頭AWS與企業(yè)數據庫巨人甲骨文(Oracle)的數據庫之爭正式浮上臺面。
  也因此,今年每一場只要打著Amazon數據庫上云的相關議程,都成了今年最搶手的熱門場次,早在活動前兩周,議程才剛公布,坐位就早已全數被預定一空,只剩下現場候位,甚至活動前一天下午,議程還沒開始,場外就已經排滿人潮,等著搶聽Amazon分享第一手的搬移經驗。Thomas Park就是其中一場專談「Amazon.com從Oracle數據庫搬上AWS經驗」的講者。
  Thomas Park表示,Amazon很早就開始采用Oracle數據存儲,在換成AWS以前,系統(tǒng)存放的資料總共有多達35PB(壓縮後),1個PB(Petabytes)等同於1,000個TB,若以一個1TB硬碟厚度平均0.7公分來計算的話,35PB的硬碟,堆成的高度超過200公尺高,這還不包括還有一個同樣壓縮過的5PB的核心資料集,也都要一并改上AWS,這正是Amazon數據存儲上云面對的最大挑戰(zhàn)。
  Amazon大數據技術資深經理Thomas Park
(攝影/余至浩)
  Amazon大數據技術資深經理Thomas Park坦言,舊有的數據庫設計方式,已無法跟上Amazon事業(yè)快速成長的腳步,所以,Amazon決定將數據庫重新打掉重練,改用新的云端數據庫設計方式來取代,以便能夠快速橫向擴展,來因應業(yè)務成長需求。
  Thomas Park在傳授數據庫搬遷經驗的過程時,也首度公開過去Amazon電子商務平臺背後采用的線上交易與數據存儲服務架構圖(自11月1日以後,Amazon數據存儲已全面改由AWS取代)。
  從這個架構圖來看,首先,Amazon所建置的一個超大型數據存儲叢集,全部都是采用Oracle RAC數據庫架構,在它上方,還有提供3個針對營運、探查與BIM數據設計的專用數據存儲或數據庫,里面用也都是Oracle, 再透過DB Link方式相連,連做為各種交易資料存放的OLTP數據庫,也都有部分使用到Oracle產品,并透過Amazon自行開發(fā)一個可以用來管理不同數據庫處理流程的ETLM管理平臺,來進行協(xié)助交易資料萃取和轉置。
  Thomas Park指出,就像其他電商平臺,Amazon剛開始,也使用許多OLTP數據庫與Oracle數據存儲,用來處理不同類型的工作負載,像是Oracle數據庫可以被用於承載交易型與非交易的工作任務,能處理的資料型態(tài),包括目錄、庫存、線上交易、網頁點擊串流,以及行銷等資料。而數據存儲則是用於蒐集大量交易數據與分析所用。
  數據庫擴充力,才是Amazon決定換掉Oracle的真正原因
  但是,為何Amazom後來決定換掉原本數據庫?Thomas Park說:「就是為了要讓數據庫具備橫向擴展(Scale Out)的能力!顾硎荆珹mazon成立20多年來,在業(yè)務發(fā)展上,從開始用來查詢交易資料與儲存使用的數據庫,用的就是Oracle數據庫及其技術,并用這些數據庫來建立Amazon網站底層的架構。但是當業(yè)務量逐漸成長,需要擴建更多的銷售據點與資料中心,并且跨入不同領域市場,對於IT團隊來說,必須要能很快擴展原有基礎設施,來迎合業(yè)務快速成長需求。
  但是舊有的數據庫設計方式,已無法跟上Amazon事業(yè)快速成長的腳步,所以,Amazon決定將自己的舊數據庫全部打掉重練,改用新的云端數據庫設計方式來取代,以便能夠快速橫向擴展,來因應業(yè)務迅速成長!高@也是我們會決定從使用已久的Oracle數據庫搬上AWS的最重要原因!巩斎怀杀疽彩橇硪淮罂剂,他事後補充說到。
  一般來說,在新舊數據庫搬遷過程中,企業(yè)會先針對舊數據庫的綱要(Schema),先經過復制或轉換,改到了目標的數據庫後,才接著將舊數據庫里存放的資料,透過如AWS DMS等數據庫搬遷工具,再將全部資料移到新的數據庫。
  不過,Thomas Park強調,當一家企業(yè)發(fā)展成長到達一定規(guī)模,要遷移數據庫,就不是一件容易的事,隨著業(yè)務量成長,系統(tǒng)架構也將日益龐大復雜,例如需要不斷擴增新數據庫與備份數據庫,來滿足營運所需,還要能依據不同關鍵性應用,來針對數據庫采用分層架構,以便於依資料使用頻率與重要程度,對應到不同的數據庫層存放,或是配合業(yè)務發(fā)展需求,采用新的數據庫架構設計,如分散式數據庫等。
  以這次35PB遷移經驗來說,Thomas Park坦言,光是要將這些資料全部搬遷到AWS環(huán)境,就花了1年多才完成,同時搬移的過程,還要確保整個數據存儲服務不能中斷,能持續(xù)穩(wěn)定運作,繼續(xù)提供原有的數據蒐集與分析服務。對Amazon的IT團隊來說,這是一大挑戰(zhàn)。
  最後,Thomas Park也說到,Amazon至今已經關掉的Oracle數據庫,少說也有數千到數萬個,現在,都已改用AWS的數據庫服務,如Redshift、Amazon RDS,Aurora與DynamoDB等。
  除了數據存儲之外,Amazon也將過去沿用了20年關鍵核心財務系統(tǒng)用的Oracle數據庫,也都一并搬上AWS,總共搬遷多達93個數據庫、185個實例,累積120TB的資料量,現在都改使用DynamoDB云端數據庫。經過改用新的數據庫以後,除了更易於管理,更高可靠,更加快近一倍的反應處理時間,也替Amazon省下70%整體成本。
  Amazon從數據庫遷移學到的10件事
  1. 必須先提高能見度,全盤了解數據庫使用狀況,以利掌控進度。
  2. 搬遷工程影響許多單位,事前須盡早尋求高層支持。
  3. 須先獲得所有數據庫管理人員的支持,搬遷才能順利。
  4. 搬遷過程,應單獨設立一組開發(fā)團隊,解決不同數據庫團隊的共通問題,有助加快遷移。
  5. 執(zhí)行全程須與AWS團隊保持密切合作。
  6. 團隊應克服對技術的恐懼,找出最棘手及真正的技術問題。
  7. 認清便宜沒好貨,應追求最高價值,而非最省成本。
  8. 以整體效率的改善,來說服尚未轉換的單位。
  9. 資料上云後,要建立統(tǒng)一管理平臺。
  10. 隨時保有擴充彈性,然後慶祝勝利到來。
  資料來源:AWS,iThome整理,2018年12月
【免責聲明】本文僅代表作者本人觀點,與CTI論壇無關。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

專題

CTI論壇會員企業(yè)