云計算是運營商優(yōu)化自身IT 架構(gòu)的重要策略之一,而如何高效的管理終端則始終困擾著企業(yè)信息化人員,尤其是需強管控的營業(yè)廳類生產(chǎn)任務(wù)型終端正面臨來自安全、運維、能耗、管理,以及TCO 成本等多方面的挑戰(zhàn)。
桌面云正是誕生于這種背景下,它是將終端計算機的各個邏輯單元進(jìn)行“松耦合”的過程,它將傳統(tǒng)模式下用戶側(cè)的操作系統(tǒng)、應(yīng)用程序和用戶數(shù)據(jù)轉(zhuǎn)移到數(shù)據(jù)中心進(jìn)行運行和保存。用戶利用瘦終端(TC)或者“智能終端+軟終端”(智能終端含普通臺式機、筆記本電腦、智能手機等),鑒權(quán)認(rèn)證后通過優(yōu)化的網(wǎng)絡(luò)協(xié)議訪問數(shù)據(jù)中心云端服務(wù)器和應(yīng)用程序。本地不保留關(guān)鍵數(shù)據(jù),實現(xiàn)用戶桌面環(huán)境的集中存儲、監(jiān)控與管理。
桌面云架構(gòu)由終端側(cè)、網(wǎng)絡(luò)側(cè)和云平臺側(cè)三部分組成[2]。終端與網(wǎng)絡(luò)側(cè)主要為用戶提供一種接入手段,云平臺側(cè)為桌面云架構(gòu)的核心,云平臺側(cè)主要包含業(yè)務(wù)層、資源管理調(diào)度層、虛擬資源層、物理資源層、網(wǎng)絡(luò)層、物理層六大部分。按功能可將六大功能模塊劃分為兩大功能域,即:管理功能域與虛擬資源域。其中虛擬資源域主要功能為將物理資源抽象為虛擬資源。管理功能域主要功能為接受用戶注冊到云平臺,并調(diào)度相應(yīng)虛擬資源給用戶。
通過引入桌面云,用戶的訪問模型由二層(終端->應(yīng)用)變?yōu)槿龑樱ǹ蛻舳?>桌面云->應(yīng)用),用戶可按需獲得更充沛的桌面應(yīng)用程序運行能力,在技術(shù)層面利用數(shù)據(jù)中心提供集中、統(tǒng)一的安全防護(hù)能力,有效的提升了企業(yè)信息安全級別,同時,利用虛擬化等技術(shù)共享后臺計算和存儲資源,桌面資源利用率提高1 倍以上。運維管理方面虛擬桌面與瘦終端的統(tǒng)一管理與交付有效推動了終端管理的標(biāo)準(zhǔn)化,同時隨用戶桌面集中至數(shù)據(jù)中心,運維效率得到極大提升,并且單用戶能耗降至50W,節(jié)能減排效益顯著。經(jīng)濟效益方面隨著用戶規(guī)模的放量,時間的遞增,整個TCO 效果愈加明顯。
目前,通用桌面云解決方案多立足于本地網(wǎng),試圖借助虛擬化技術(shù)將一個或幾個數(shù)據(jù)中心的計算能力整合后交付給最終用戶,對于當(dāng)前用戶規(guī)模,現(xiàn)有架構(gòu)基本可以實現(xiàn)預(yù)期目標(biāo),但并不足以支撐將桌面云作為一種通用解決方案進(jìn)行推廣。
本文通過對現(xiàn)有架構(gòu)進(jìn)行分析,結(jié)合運營商生產(chǎn)任務(wù)型終端場景,建立了一套符合運營商實際,并能充分解決目前終端管理困擾的一體化桌面云架構(gòu),并以用戶體驗為核心對現(xiàn)有資源調(diào)度策略進(jìn)行優(yōu)化,為桌面云的順利推廣奠定了基礎(chǔ)。
1 一體化桌面云架構(gòu)
造成傳統(tǒng)桌面云局限性的最主要原因是現(xiàn)有架構(gòu)沒有站在整體的角度去匹配用戶需求。首先,從管理角度來看,現(xiàn)有架構(gòu)下終端依舊為分點、分散管理,缺乏一種標(biāo)準(zhǔn)的辦法和手段來支撐全集團對終端的統(tǒng)一管控;其次,從風(fēng)險角度來看,桌面云的引入實際上是在用戶與后臺系統(tǒng)之間增加了一層,它的可靠性、穩(wěn)定性直接決定了用戶體驗,因此,不能簡單的將桌面云作為普通的IT 系統(tǒng)考慮,它的重要性級別應(yīng)約等于后臺CRM 類業(yè)務(wù)系統(tǒng),同時隨終端集中,服務(wù)中斷風(fēng)險對現(xiàn)有架構(gòu)提出了新的考驗;再次,從資源共享的角度,桌面云是一種IaaS 服務(wù)[4],它將數(shù)據(jù)中心的計算能力抽象后提供給用戶,分散架構(gòu)分區(qū)域建立多片云,但云之間難以交互,這與云計算資源整合、資源共享的理念相違背;最后,從成本的角度,分散架構(gòu)難以形成規(guī)模效應(yīng)、無法發(fā)揮云計算集約性優(yōu)勢,容易照成資源的浪費。
通過上文分析,集中化架構(gòu)是提升桌面云能力,實現(xiàn)統(tǒng)一管控的一種有效手段。集中的最大瓶頸在于網(wǎng)絡(luò),單用戶虛擬終端帶寬需求在100-200kbps 之間,同時虛擬終端對網(wǎng)絡(luò)的時延、抖動要求較高,對于運營商十萬級的終端規(guī)模,現(xiàn)有DCN 網(wǎng)尚無集中承載所有虛擬終端的能力。因此需對現(xiàn)有桌面云架構(gòu)進(jìn)行充分解耦,分析各個功能模塊的集中需求,采用分級集中的方式實現(xiàn)標(biāo)準(zhǔn)、統(tǒng)一。
虛擬資源域的集中需求主要來自于場景、運維與成本三個方面。營業(yè)廳類生產(chǎn)任務(wù)型終端主要任務(wù)在于與后臺CRM 類業(yè)務(wù)系統(tǒng)的信息交互,目前運營商的CRM 類業(yè)務(wù)系統(tǒng)已實現(xiàn)分省集中部署,電子渠道類系統(tǒng)甚至已全國集中,因此將虛擬終端集中至數(shù)據(jù)中心后,可以將系統(tǒng)間的大數(shù)據(jù)量交互消化在數(shù)據(jù)中心內(nèi)部,可極大的改善用戶體驗。運維方面,虛擬終端集中后,原有分散的運維方式得到了極大的改善,運維工作可集中在數(shù)據(jù)中心內(nèi)部完成,提升了運維響應(yīng)速度的同時,極大的降低了運維隊伍規(guī)模。成本方面,集中后產(chǎn)生的規(guī)模效應(yīng)可有效的改善運營成本。但受限于虛擬終端的帶寬需求與用戶SLA 與QoS 要求,尚不具備將虛擬終端進(jìn)行物理全國集中的條件,同時考慮部分業(yè)務(wù)系統(tǒng)分省集中部署的現(xiàn)狀,考慮對虛擬資源域分省集中。
圖1 一體化桌面云架構(gòu)
管理功能域的集中需求主要來自管理、安全、服務(wù)可靠性三部分。桌面云對運營商生產(chǎn)任務(wù)型終端管理的最大提升在于提供一種標(biāo)準(zhǔn)、統(tǒng)一的管理手段,管理是運營商引入桌面云的最主要驅(qū)動。將管理功能集中后,可提供統(tǒng)一的終端管理手段,實現(xiàn)完整的終端資產(chǎn)管理;其次,管理功能集中使標(biāo)準(zhǔn)終端桌面鏡像、統(tǒng)一補丁分發(fā)成為可能,有效提升了終端的標(biāo)準(zhǔn)化程度,規(guī)避了敏感信息泄露的風(fēng)險;最后,管理功能集中后可實現(xiàn)虛擬資源的跨省、跨區(qū)域調(diào)度,規(guī)避了某個數(shù)據(jù)中心宕機導(dǎo)致服務(wù)中斷的風(fēng)險。同時管理功能集中并無網(wǎng)絡(luò)等方面因素制約,因此考慮將管理功能域全國集中。
圖2 一體化架構(gòu)與傳統(tǒng)架構(gòu)對比分析
2 一體化桌面云架構(gòu)下資源的調(diào)度與管理
2.1 資源池創(chuàng)建原理
一個高可用、可動態(tài)擴展的計算資源池是桌面云解決方案成功的基礎(chǔ),計算資源池是借助Hypervisor(虛擬資源層)的能力通過將物理服務(wù)器虛擬成多個VM(虛擬機)而形成的。
Hypervisor 采用混合型虛擬化架構(gòu)模式,如下圖。其中Hypervisor 為介于硬件與操作系統(tǒng)之間的一個薄軟件層,實際上為一個經(jīng)過裁剪改造的linux,主要功能為虛擬硬件資源,為服務(wù)器上運行的虛擬機提供一個運行時環(huán)境。hypervisor 負(fù)責(zé)各虛擬機間CPU、內(nèi)存的管理與調(diào)度,但不能處理網(wǎng)絡(luò)、IO、存儲等請求。這些請求借助其上運行的HOST OS 的I/O 設(shè)備驅(qū)動能力實現(xiàn)。HOST OS 是唯一運行于Hypervisor 之上的虛擬機,它具有訪問物理I/O 資源的權(quán)限,負(fù)責(zé)與其他虛擬機的交互。Hypervisor 同時負(fù)責(zé)多個VM 間物理資源的動態(tài)調(diào)配。
2.2 物理硬件資源層資源調(diào)度
云計算是一種破壞性的創(chuàng)新,它通過整合物理資源成功消除了傳統(tǒng)應(yīng)用系統(tǒng)“煙囪式”架構(gòu)的種種弊端,但它在帶來資源共享、按需分配等好處的同時,也對現(xiàn)有技術(shù)架構(gòu)、運維體系產(chǎn)生了巨大的沖擊,如何保障桌面云化后用戶體驗不降低已成為以桌面云為代表的云計算解決方案成敗的關(guān)鍵。由于對虛擬資源的調(diào)度與管理很大程度上決定了桌面云平臺所提供的服務(wù)質(zhì)量,本文的另一個研究重點是設(shè)計一套適用于一體化桌面云架構(gòu)的資源調(diào)度與管理策略,以便將合適的虛擬資源交付給最終用戶,并通過資源的動態(tài)調(diào)配來保障用戶體驗。
圖3 混合型虛擬化架構(gòu)模式
2.2.1 傳統(tǒng)桌面云架構(gòu)下物理硬件資源層資源調(diào)度
在桌面云架構(gòu)中,包含對底層物理硬件資源以及資源池中的虛擬資源兩個層面的調(diào)度與管理。對于底層物理硬件資源的調(diào)度與管理主要由Hypervisor 實現(xiàn)。Hypervisor 對資源調(diào)度實際上是一個將VCPU 映射至物理CPU 的過程,Hypervisor 以VCPU 為單位來對硬件資源進(jìn)行調(diào)度,首先Hypervisor 為GUEST VM分配相應(yīng)VCPU(一個GUEST VM 可對應(yīng)多個VCPU,但同一VCPU 只能分配給唯一的GUEST VM),之后GUEST OS 通過自有的線程調(diào)度算法將核心線程映射到VCPU 上。最終VCPU 由Hypervisor 上的調(diào)度算法映射至物理CPU 上。
Hypervisor 資源調(diào)度算法Credit是一個按比例共享物理CPU 資源的非搶占式調(diào)度算法,它的核心思想是將物理CPU 資源公平的分配給每一個VCPU。Credit 算法通過為GUEST VM 定義二元組(weight,cap)來標(biāo)識虛擬機對物理cpu 占用的優(yōu)先級。其中weight 值表示當(dāng)前虛擬機可以占用物理cpu 時間的比例,cap 值表示虛擬機可占用的最大物理CPU 時間。
圖4 credit 算法
每個VCPU 有over,under 兩個優(yōu)先級,Credit算法為每個物理CPU 維護(hù)兩個雙鏈表隊列,即Under隊列與Over 隊列。隊列上的元素為被分配到該物理CPU 上運行的VCPU,隊列按照先到先服務(wù)方式排序。Credit 算法通過監(jiān)測每個VCPU 的credit 值消耗(由對應(yīng)VM 的weight 與cap 計算得出)來調(diào)整隊列上VCPU 的服務(wù)順序。當(dāng)credit>0 時,表示該VCPU 請求的資源尚未被足額分配,仍可被物理CPU 調(diào)度,處于under 優(yōu)先級;當(dāng)credit<0 時,表示分配給該VCPU的時間片已經(jīng)被消耗完,不能再被CPU 調(diào)度,處于over 優(yōu)先級。
當(dāng)一個VCPU 被調(diào)度執(zhí)行時,Credit 算法會每隔10ms 觸發(fā)一次時間中斷,并將當(dāng)前運行的VCPU 的credit 值減掉100,如果credit 值>0,則繼續(xù)執(zhí)行,否則將它插入到over 隊列的尾部。每隔30ms,如果under隊列上VCPU 排序仍沒有變化,Credit 算法會對under隊列重新排序,將當(dāng)前運行的VCPU 放至under 隊列隊尾,即當(dāng)一個VCPU 的credit 值夠多時,它最多可以運行3 個調(diào)度時長。如果當(dāng)前VCPU 均處于over 隊列時,Credit 算法支持從其他物理CPU 隊列中調(diào)度處于under 優(yōu)先級的VCPU 運行。只有當(dāng)前所有VCPU均處于over 隊列時,才會對所有活動VCPU 重新賦值。
2.2.2 物理硬件資源層資源調(diào)度優(yōu)化
Credit 算法實現(xiàn)了將物理CPU 資源公平的分配給用戶,但在實際場景中,用戶的優(yōu)先級并不相同,不同用戶的SLA 與QoS 存在差異。以營業(yè)廳為例,存在主管、VIP 營業(yè)員、普通營業(yè)員三類用戶角色。這三類角色業(yè)務(wù)緊迫性程度: VIP 營業(yè)員>普通營業(yè)員>主管,因此結(jié)合用戶場景緊迫程度高的用戶需被優(yōu)先響應(yīng)。
本文針對營業(yè)廳類生產(chǎn)任務(wù)型場景提出了一種改進(jìn)型Credit 算法,在新的算法中,為物理CPU 額外維護(hù)一個boost 隊列,位于該隊列的VCPU 處于就緒狀態(tài),即,當(dāng)前映射在物理CPU 上的VCPU 結(jié)束運行后,優(yōu)先調(diào)度位于booest 隊列上的VCPU。同時為每個GUEST VM 增加一個屬性:優(yōu)先權(quán)值(factor),用于標(biāo)識被調(diào)度VM 上承載業(yè)務(wù)的緊迫程度。當(dāng)VCPU 結(jié)束運行應(yīng)被移到under 隊尾時,檢測其對應(yīng)factor 值是否大于0,如果大于0,則將該VCPU 放入booest 隊列,F(xiàn)actor 值減1,boost 隊列按factor 值大小進(jìn)行排序,只有當(dāng)boost 隊列為空時,才會調(diào)度under 隊列中的VCPU,factor 值刷新頻率與credit 值刷新頻率保持一致。改進(jìn)后,只要一個VM 的優(yōu)先級較高(即factor值>0),當(dāng)它自身時間片消耗完后,不會被放置與under隊尾,而是按其factor 值放置于boost 隊列相應(yīng)位置,從而保障優(yōu)先級較高的用戶可以搶占比它優(yōu)先級低的VCPU, 實現(xiàn)此類高級別用戶延遲的降低。
2.2.3 虛擬資源調(diào)度優(yōu)化
資源池建立之后,如何將虛擬資源(即VM)高效、合理的分配給用戶便成了最大問題。資源調(diào)度的目標(biāo)是動態(tài)平衡資源池中各節(jié)點的工作負(fù)載,同時保證服務(wù)的高可用性。在一體化的桌面云架構(gòu)中,將以此資源調(diào)度過程劃分為四個步驟:資源請求、資源探測、資源選擇、資源監(jiān)控。
為統(tǒng)一管理這些虛擬資源,將每個可用的虛擬資源抽象成一個可調(diào)度單元(Unit),每個Unit 由一個二元組V(C,M)確定,其中C 表示CPU 大小,M 表示內(nèi)存大小。則一臺物理服務(wù)器Si 最多能虛擬的Unit數(shù)為:
同時引入分組的思想,將具有相同使用特點的資源分組,從而避免因統(tǒng)一調(diào)度大量無規(guī)則資源對云平臺性能的消耗,即為可調(diào)度單元引入新屬性F,每個Unit 由一個三元組V(C,M,F(xiàn))決定,其中F 表示資源的核心特性,結(jié)合上文對生產(chǎn)任務(wù)型終端的分類,生產(chǎn)任務(wù)型場景下共包含三類不同特性的虛擬資源。當(dāng)用戶登入云平臺,并輸入相應(yīng)能力需求即完成了資源請求。云平臺接到用戶資源請求之后,會首先通過安裝在每臺服務(wù)器節(jié)點上的數(shù)據(jù)收集模塊探測節(jié)點負(fù)載信息(即:計算每個資源節(jié)點剩余的不同特性的可用資源數(shù)量)與服務(wù)器響應(yīng)時間。
然后采用動態(tài)優(yōu)先權(quán)(Priority)算法,選擇Priority值最高節(jié)點,將其上與用戶特性相匹配的虛擬資源交付給用戶。動態(tài)優(yōu)先權(quán)(Priority)算法即將服務(wù)器分組,給每個組定義不同優(yōu)先權(quán),用戶請求會分配給優(yōu)先權(quán)最高的服務(wù)器組(在同一組內(nèi),采用輪詢或比率算法,分配用戶的請求)。每組服務(wù)器的Priority 值由當(dāng)前節(jié)點的負(fù)載情況與服務(wù)器響應(yīng)時間共同決定。動態(tài)優(yōu)先權(quán)算法的核心思想是用戶請求由當(dāng)前負(fù)載最小且響應(yīng)最短的資源節(jié)點承載。
其中,F(xiàn) 表示用戶需求特性權(quán)重,LT 表示服務(wù)器響應(yīng)時間,μ表示時間優(yōu)先權(quán)轉(zhuǎn)換比。當(dāng)用戶請求到Priority= Unittotal*F + LT*μ達(dá)時,Priority 值動態(tài)更新。
最后云平臺會跟根據(jù)運行在每個節(jié)點上的Agent反饋的狀態(tài)信息對每個服務(wù)器節(jié)點進(jìn)行實時監(jiān)控,一旦某個節(jié)點發(fā)生故障,云平臺會將用戶桌面遷移至其他資源節(jié)點。
3 結(jié)語
云計算對整個IT 產(chǎn)業(yè)的影響日益深遠(yuǎn),它已成為運營商解決自身IT 問題的重要手段。云計算已經(jīng)不再局限于一種技術(shù)手段,它開始更多的從服務(wù)模式、產(chǎn)業(yè)鏈構(gòu)成、管控架構(gòu)方面改變企業(yè)。桌面云作為云計算破壞式創(chuàng)新的產(chǎn)物從終端管理薄弱環(huán)節(jié)入手,優(yōu)化IT 產(chǎn)品和服務(wù),并推動傳統(tǒng)IT 運營體系的變革。本文搭建起一套適應(yīng)未來發(fā)展的一體化桌面云架構(gòu),并在此架構(gòu)下,結(jié)合運營商營業(yè)廳類生產(chǎn)任務(wù)型場景,通過引入業(yè)務(wù)重要性級別對hypervisor 層資源調(diào)度算法進(jìn)行優(yōu)化,同時在此基礎(chǔ)上對虛擬資源調(diào)度策略進(jìn)行改進(jìn),以提升用戶體驗。本文所設(shè)計的架構(gòu)與優(yōu)化策略已成功應(yīng)用于國內(nèi)某運營商,有效推動了其終端云化進(jìn)程,解決了終端管理面臨的種種難題。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://m.nttd-wave.com.cn/
本文標(biāo)題:面向一體化桌面云架構(gòu)的資源調(diào)度與管理策略
本文網(wǎng)址:http://m.nttd-wave.com.cn/html/consultation/1083938284.html