本文詳細(xì)介紹數(shù)據(jù)中心建設(shè)及規(guī)劃過程容易出現(xiàn)的9個(gè)誤區(qū),通過對(duì)誤區(qū)逐一剖析,從而指導(dǎo)建設(shè)人員在數(shù)據(jù)中心中,有效規(guī)避問題,更合理的進(jìn)行規(guī)劃。
很多企業(yè)的的業(yè)務(wù)都運(yùn)行在安全容量范圍之外,而可以用于擴(kuò)展的空間又非常有限或者根本不存在。據(jù)統(tǒng)計(jì),數(shù)據(jù)中心的平均使用年限為 9 年。然而 Gartner 的數(shù)據(jù)顯示任何運(yùn)營超過7年的設(shè)施都趨于陳舊。
數(shù)據(jù)中心設(shè)施過時(shí)或者內(nèi)部空間過于擁擠成為企業(yè)業(yè)務(wù)增長(zhǎng)的“攔路虎”,這時(shí)建設(shè)新的數(shù)據(jù)中心有時(shí)就成為唯一的解決辦法。當(dāng)投放市場(chǎng)的速度成為成敗關(guān)鍵的時(shí)候,沒有對(duì)業(yè)務(wù)需求作出適當(dāng)評(píng)估的企業(yè)會(huì)讓數(shù)據(jù)中心建設(shè)走進(jìn)死胡同,既無法保障可用性也無法滿足未來業(yè)務(wù)的需求。
那么如何在新建和擴(kuò)建數(shù)據(jù)中心之時(shí)避免犯錯(cuò)?設(shè)計(jì)和建設(shè)數(shù)據(jù)中心時(shí),實(shí)施的方法是極為關(guān)鍵的。很多時(shí)候,企業(yè)只根據(jù)單位面積功率,單位建筑面積成本和 Tier 等級(jí)來規(guī)劃數(shù)據(jù)中心,但這些指標(biāo)可能會(huì)與其總體業(yè)務(wù)目標(biāo)和需要承擔(dān)的風(fēng)險(xiǎn)不一致。規(guī)劃不善導(dǎo)致投資使用不良和運(yùn)營成本的增加。
很多企業(yè)則只注重細(xì)枝末節(jié),過分關(guān)注“速度和供給”,綠色環(huán)保,并行維護(hù),電力使用效率(PUE)和綠色建筑 (LEED)認(rèn)證。盡管所有這些指標(biāo)在決策過正中都十分重要,但是過分注重細(xì)節(jié)會(huì)影響對(duì)全局的把握。有不少數(shù)據(jù)中心因?yàn)閿?shù)據(jù)中心擴(kuò)建而錯(cuò)過商業(yè)機(jī)會(huì),所以應(yīng)該用把握全局的方法實(shí)施擴(kuò)建項(xiàng)目。
有大量的咨詢公司及相關(guān)人員可以為規(guī)劃提供幫助,但是評(píng)估這些咨詢建議和設(shè)想的工作量將是非常巨大的。關(guān)鍵 IT 容量在 1-3 MW 的范圍內(nèi)數(shù)據(jù)中心很容易陷入這種麻煩。中型數(shù)據(jù)中心用戶對(duì)關(guān)鍵性的要求也不比大型兆瓦級(jí)用戶低。但是內(nèi)部技術(shù)人員實(shí)施擴(kuò)建的專業(yè)知識(shí)和經(jīng)驗(yàn)可能比較有限,來自多方的信息量過大導(dǎo)致思維混亂和作出錯(cuò)誤的決策。
未將總擁有成本納入考量
僅僅關(guān)注投資成本是一個(gè)很容易落入的陷阱,新建或擴(kuò)建所需的成本往往會(huì)令人產(chǎn)生錯(cuò)覺。盡管投資成本(CapEx)建模非常關(guān)鍵,但是如果未將數(shù)據(jù)中心基礎(chǔ)設(shè)施的運(yùn)維成本(OpEx)納入計(jì)算,那么整體的業(yè)務(wù)規(guī)劃流程的效果就會(huì)受到嚴(yán)重削弱。
對(duì)數(shù)據(jù)中心運(yùn)營成本(OpEx)建模需要兩個(gè)關(guān)鍵的子項(xiàng):運(yùn)行成本和維護(hù)成本。維護(hù)成本包括所有維護(hù)數(shù)據(jù)中心所有基礎(chǔ)設(shè)施的成本。這包括 OEM 設(shè)備的維護(hù)合同,數(shù)據(jù)中心清潔支出,雇傭維修和升級(jí)承包商等費(fèi)用。運(yùn)行成本包括所有與日常運(yùn)營和現(xiàn)場(chǎng)工作人員相關(guān)的成本。這包括雇員工資,人員專業(yè)技術(shù)培訓(xùn)和安全培訓(xùn),數(shù)據(jù)中心運(yùn)行文件歷史記錄,容量管理以及質(zhì)量監(jiān)督條例和程序等費(fèi)用。如果無法計(jì)算出 3 - 7 年的運(yùn)維支出預(yù)算,那么建立投資回報(bào)(ROI)模型來作出明智的決策是無法實(shí)現(xiàn)的。
另一個(gè)常見的錯(cuò)誤是來自估算本身。董事會(huì)所批準(zhǔn)的財(cái)務(wù)預(yù)算對(duì)與新建或者擴(kuò)建數(shù)據(jù)中心來說太少,因而導(dǎo)致項(xiàng)目失敗。決策的流程如下所示:
?資金申請(qǐng)?zhí)岢龊螳@得暫時(shí)性通過。財(cái)務(wù)部門應(yīng)該參與調(diào)查和獲取信息,創(chuàng)建最接近實(shí)際的預(yù)算。
?花費(fèi)必要的時(shí)間推進(jìn)以上決定預(yù)算的流程。
?調(diào)查發(fā)現(xiàn)原來的預(yù)算提案數(shù)額太低。
?項(xiàng)目被延遲;雇員受到影響;針對(duì)外部和內(nèi)部客戶的服務(wù)執(zhí)行能力受到影響;預(yù)期受到影響。
?這最終導(dǎo)致整個(gè)周期回到原點(diǎn),這正是因?yàn)闆]有避免第一個(gè)誤區(qū),未將總擁有成本(TCO)納入考量,沒有建立一個(gè)全面的財(cái)務(wù)模型。
建設(shè)成本的問題本可以輕松避免,但是如果你無法規(guī)避誤區(qū)三,那么第二個(gè)誤區(qū)又是無可避免的。
未制定適當(dāng)?shù)脑O(shè)計(jì)指標(biāo)和性能參數(shù)
有兩種“錯(cuò)招”可能將企業(yè)推進(jìn)超支的死亡漩渦。第一點(diǎn)就是人人可能都喜歡可用性為Tier 3 或更高的設(shè)計(jì)方案,但是并不是每個(gè)人都確實(shí)需要這樣的高可用性。第二點(diǎn)大多數(shù)的功率密度,kW/平方米和kW/機(jī)柜并不與實(shí)際的業(yè)務(wù)需求相匹配。
很多時(shí)候,“必須建成功率密度為 3 kW/平方米”這樣的方案是很不合理的。千萬不要過度規(guī)劃建設(shè),那樣只會(huì)浪費(fèi)資金??捎眯栽礁叩臄?shù)據(jù)中心在運(yùn)維和能源上的開銷也會(huì)越高。如果走入這個(gè)誤區(qū)將會(huì)讓創(chuàng)建業(yè)務(wù)模型和投資回報(bào)(ROI)分析的基礎(chǔ)偏離真實(shí)。首先要建立正確的設(shè)計(jì)指標(biāo)和性能參數(shù)。然后圍繞這些指標(biāo)和參數(shù)構(gòu)建投資成本和和運(yùn)營成本。
設(shè)施選址凌駕于設(shè)計(jì)指標(biāo)之上
企業(yè)往往在確定設(shè)計(jì)指標(biāo)和性能參數(shù)到位之前已經(jīng)開始為設(shè)施的建設(shè)進(jìn)行選址了。在缺少這些關(guān)鍵的信息的情況下勘察和評(píng)估場(chǎng)地并沒有實(shí)際的意義。這種“本末倒置”的情況經(jīng)常發(fā)生于 1-3 MW的數(shù)據(jù)中心用戶群。兆瓦級(jí)的數(shù)據(jù)中心用戶通常都是這個(gè)領(lǐng)域的專家,會(huì)將市電的可用性和成本、光纖網(wǎng)絡(luò)接入、地理風(fēng)險(xiǎn)(例如地震,臺(tái)風(fēng)和洪水高發(fā)區(qū))等納入考量范圍,而基本的用戶則通常在其業(yè)務(wù)模式所顯示的需求,在其業(yè)務(wù)覆蓋的核心區(qū)域內(nèi)建設(shè)或翻新場(chǎng)地來興建數(shù)據(jù)中心。
過早選址或者僅基于地理位置選址帶來的問題讓數(shù)據(jù)中心的選址無法滿足設(shè)計(jì)要求。舉例來說,在辦公室所在大樓內(nèi)或者幾個(gè)街區(qū)以外部署數(shù)據(jù)中心確實(shí)很方便,但是關(guān)鍵業(yè)務(wù)的數(shù)據(jù)中心有一系列的場(chǎng)地要求,往往需要花費(fèi)巨額投資成本才能在多租戶的商業(yè)大樓滿足這些要求,而且未來擴(kuò)建的空間也會(huì)受到限制。
空間規(guī)劃凌駕于設(shè)計(jì)指標(biāo)之上
用于安防數(shù)據(jù)中心基礎(chǔ)設(shè)施組件所用的物理空間和場(chǎng)地面積會(huì)是很巨大的。在最高可用性的系統(tǒng)中,高架地板面積即 IT 機(jī)房面積與支持設(shè)備所占的面積之間的比值可以高達(dá) 1:1。很多企業(yè)和機(jī)構(gòu)只按 IT 設(shè)備所占的面積規(guī)劃對(duì)空間和面積的要求,然而制冷和電氣設(shè)備同樣需要占用大量的空間。此外,很多企業(yè)沒有注意到辦公空間所要占用的面積。因此在進(jìn)入規(guī)劃面積的步驟之前,確定設(shè)計(jì)指標(biāo)是極為重要的。如果沒有設(shè)計(jì)指標(biāo),計(jì)算滿足整體需求的總體空間和面積將無從談起。
設(shè)計(jì)缺乏靈活性,鉆入死胡同
數(shù)據(jù)中心行業(yè)在推廣模塊化設(shè)計(jì)的重要性方面取得了長(zhǎng)足的進(jìn)步。但是使用模塊化的方案并不能保證一定成功。模塊化的方案所基于的理念是只在需要更多容量的時(shí)候及時(shí)地添加所需的基礎(chǔ)設(shè)施設(shè)備,以此來保護(hù)投資的有效性。仍然有企業(yè)因?yàn)殄e(cuò)誤地估計(jì)未來的需求而導(dǎo)致他們自己鉆入死胡同。任何事情都有可能發(fā)生變化。靈活的模塊化審計(jì)方案是保證長(zhǎng)遠(yuǎn)利益的關(guān)鍵。因?yàn)檎?因并購而導(dǎo)致業(yè)務(wù)成幾何級(jí)數(shù)的增長(zhǎng)或者未列入規(guī)劃的高密度設(shè)備的應(yīng)用,即使是最好的功率密度規(guī)劃也會(huì)過時(shí)。在電氣方面,保證設(shè)計(jì)方案應(yīng)該預(yù)留在已部署模塊在線添加 UPS 容量的能力。
將配電系統(tǒng)的輸入和輸出設(shè)計(jì)成能夠滿足未來變化的需要。為了滿足未來容量增長(zhǎng)的需要而過度規(guī)劃配電系統(tǒng)所帶來的成本并不會(huì)帶來顯著的 TCO 增加。機(jī)械制冷方面,大多數(shù)用戶采用傳統(tǒng)的房間級(jí)制冷、適當(dāng)?shù)母呒艿匕迳疃纫约袄錈嵬ǖ啦季志湍軡M足其制冷需求。但是一旦引入高密度設(shè)備,一切將發(fā)生改變。所以應(yīng)該保證設(shè)計(jì)核心能夠通過在線實(shí)施的方式添加行級(jí)或者機(jī)柜級(jí)制冷解決方案。
曲解PUE的概念
電力使用效率(PUE)是一個(gè)能有效衡量效率并推動(dòng)效率提升的工具。但是對(duì)能源效率的定義并不嚴(yán)謹(jǐn),這最終導(dǎo)致對(duì) PUE 的曲解。在幾乎所有的新建和擴(kuò)建數(shù)據(jù)中心中,獲得較低的 PUE 值會(huì)產(chǎn)生額外的投資成本。很多時(shí)候企業(yè)源于自身良好的愿望設(shè)定一個(gè) PUE 目標(biāo),卻沒有考慮所有的應(yīng)該考慮的因素。實(shí)際上充分了解為了達(dá)到既定目標(biāo)所要付出的投資成本和投資回報(bào)率(ROI)是非常必要的。我們需要弄清楚總擁有成本(TCO)和 PUE 目標(biāo)之間的連帶依存關(guān)系。
展示和了解 PUE,ROI 和 TCO 之間微妙的平衡關(guān)系的途徑有很多。在這里列出了三種有代表性的需要引起警示的例子:
PUE 設(shè)計(jì)指標(biāo)的設(shè)定應(yīng)該以什么情況為參考?是“最佳日”的測(cè)量值,還是基于年平均值計(jì)算?
PUE 計(jì)算是應(yīng)該基于數(shù)據(jù)中心滿負(fù)載情況還是部分負(fù)載情況?所有設(shè)備的效率曲線都會(huì)因?yàn)樨?fù)載率的不同而變化。在真實(shí)運(yùn)行狀態(tài)下,PUE 值也會(huì)因時(shí)間和日期不同而變化。
最后,關(guān)于水冷冷水機(jī)和風(fēng)冷冷水機(jī)的爭(zhēng)論也一直在繼續(xù)。每種設(shè)計(jì)多會(huì)衍生出更過的“自然冷卻”或“節(jié)能冷卻模式”應(yīng)用配置來降低 PUE。例如,在權(quán)衡決策 TCO 和 ROI的時(shí)候,我們應(yīng)該考慮采用水冷冷機(jī)方案對(duì)補(bǔ)水和水處理之中運(yùn)維方面的要求。由此可以認(rèn)識(shí)到一個(gè)典型的 2 MW 數(shù)據(jù)中心如果使用冷卻塔可能需要消耗 190 到 230 噸水。
有效利用PUE可以滿足總體的業(yè)務(wù)目標(biāo)。但是要加以小心,不要陷入因?yàn)榍庥?jì)算公式而錯(cuò)誤計(jì)算投資成本和運(yùn)營成本預(yù)算的困境。
曲解LEED認(rèn)證
到目前為止,美國綠色建筑協(xié)會(huì)(USGBC)沒有為數(shù)據(jù)中心確定專屬的LEED認(rèn)證指標(biāo)。而是可以通過商業(yè)建筑標(biāo)準(zhǔn)通過認(rèn)證。三個(gè)基本的認(rèn)知錯(cuò)誤:
?對(duì)限定條件缺乏基本認(rèn)知??梢酝ㄟ^閱讀相關(guān)參考文獻(xiàn)加以改善。
?事后產(chǎn)生追加 LEED 認(rèn)證的想法。獲得 LEED 認(rèn)證應(yīng)該是在概念設(shè)計(jì)階段開始,那么在項(xiàng)目揭示的時(shí)候被授予正式的認(rèn)證。在規(guī)劃階段的初期就應(yīng)該有 LEED 認(rèn)證的工程師或者能夠提供此項(xiàng)服務(wù)的咨詢公司參與進(jìn)來。
?獲得認(rèn)證會(huì)產(chǎn)生額外的成本。未將這些成本計(jì)入會(huì)對(duì)總擁有成本(TCO)和 商業(yè)決策產(chǎn)生影響。
設(shè)計(jì)方案過度繁復(fù)
如前所述,越簡(jiǎn)單的設(shè)計(jì)越好。即使給定可用性要求,仍然有十幾種方法可以設(shè)計(jì)出有效的系統(tǒng)。常見的情況是,是冗余加劇了復(fù)雜性的形成。即使是模塊化的系統(tǒng),加入不同的方案后,系統(tǒng)很快變得繁復(fù)起來。當(dāng)在內(nèi)部討論方案,或者從廠商尋求咨詢的時(shí)候首要的目標(biāo)就是如何保持設(shè)計(jì)方案簡(jiǎn)約。這樣做的原因是:
?繁復(fù)就意味著更多的設(shè)備和組件,而更多的組件就意味著更多的故障點(diǎn)。
?人為失誤。數(shù)據(jù)大小略有不同,但是其趨勢(shì)的指向是一致的。大部分?jǐn)?shù)據(jù)中心宕機(jī)是由人為失誤導(dǎo)致的。復(fù)雜系統(tǒng)增加了運(yùn)營的風(fēng)險(xiǎn)。
?成本。簡(jiǎn)單的系統(tǒng)意味著更少的建設(shè)成本。
?運(yùn)營和維護(hù)成本。繁復(fù)就意味著更多的設(shè)備和組件,其所需的運(yùn)營和維護(hù)成本將呈幾何級(jí)數(shù)上升。
? 設(shè)計(jì)應(yīng)以實(shí)際使用為基準(zhǔn)。許多設(shè)計(jì)方案在圖紙上看很優(yōu)秀。從圖紙上判斷和選擇配置并評(píng)估可用性風(fēng)險(xiǎn)看似容易。但是如果設(shè)計(jì)方案沒有考慮“可維護(hù)性”,在維修時(shí),系統(tǒng)的可用性將承受風(fēng)險(xiǎn)和人員安全也受到威脅。
總結(jié):盡管有很多以往數(shù)據(jù)中心建設(shè)和擴(kuò)建的失敗案例,但這并不意味著下一個(gè)數(shù)據(jù)中心項(xiàng)目就也會(huì)如此。通過避免進(jìn)入本文列出的九大誤區(qū),你將能夠在一條通往成功的道路上邁步前行。總結(jié)來看:
1. 使用基于總擁有成本(TCO)的方案: 整體業(yè)務(wù)支出分析與風(fēng)險(xiǎn)分析關(guān)聯(lián); 將投資成本(CapEx)、運(yùn)營成本(OpEx)和能源成本納入成本模型。
2. 確定設(shè)計(jì)指標(biāo)和性能參數(shù):使設(shè)計(jì)指標(biāo)基于風(fēng)險(xiǎn)分析和業(yè)務(wù)目標(biāo);按設(shè)計(jì)指標(biāo)確定設(shè)計(jì)方案,包括關(guān)鍵性等級(jí)、選址、空間布局規(guī)劃。
3. 保持設(shè)計(jì)方案簡(jiǎn)約和靈活性:采用可以滿足可用性要求的設(shè)計(jì)方案,但也要保證較低的建設(shè)和運(yùn)營成本,簡(jiǎn)約的設(shè)計(jì)是關(guān)鍵;通過具有靈活性的設(shè)計(jì)方案滿足計(jì)劃之外的擴(kuò)建需求
4. 如果 PUE 和 LEED 認(rèn)證是指標(biāo)的一部分,應(yīng)充分了解常見的誤區(qū)和實(shí)施的成本。通過基于總擁有成本(TCO)的規(guī)劃方法,就可以使新建的數(shù)據(jù)中心設(shè)施滿足企業(yè)現(xiàn)在和未來對(duì)性能的要求和業(yè)務(wù)的需求。
(本文來源于網(wǎng)絡(luò))