- 相關推薦
基于軟件定義網絡的媒體分發網絡的接入控制論文
針對軟件定義網絡(SDN)環境下的媒體分發計算機網絡的接入控制問題,提出了一種綜合考慮服務節點和傳輸鏈路服務性能優化問題的接入控制方案。該方案利用SDN控制器對路由器的直接管控和對全網的感知能力,對應用層上服務節點服務性能和網絡層上服務節點到用戶之間的傳輸鏈路的服務性能進行聯合優化,減少了鏈路擁塞對數據傳輸和用戶服務質量的影響。首先,為SDN服務系統的接入控制過程建立部分可觀Markov決策過程(POMDP)模型;然后,使用基于觀測的隨機策略作為系統的接入控制策略;最后,通過策略梯度算法對接入控制策略進行優化,求解出模型的最優策略。仿真結果表明,與盡力而為的服務策略相比,基于POMDP模型的最優接入控制策略使系統性能提高了10%,驗證了所提方法的有效性。
0引言
采用媒體分發網絡的視頻接入系統對傳輸時延和帶寬具有高度靈敏性,許多工作致力于研究如何提高該類系統的性能和媒體分發的效率。接入控制在資源有限情況下對于提高系統資源利用率、提供服務質量保障非常重要[1]。選擇一個好的接入控制策略可以保證在資源有限情況下,最大化系統資源利用率;同時顯著地減少相應延遲,讓更多的用戶享受到高質量的服務[2]。
研究傳統媒體分發網絡的接入控制問題時,主要利用可獲取得到的服務節點的容量和負載等信息,來制定接入控制方案,即主要考慮應用層上服務節點的服務能力存在瓶頸,通過尋找最優策略來優化節點的服務性能,從而提高系統資源利用率和用戶的服務質量。目前,關于傳統媒體分發網絡的接入控制問題的研究有很多,基于閾值的接入控制方法由于結構簡單且易于實現,已經被廣泛應用[3],其中幾種基礎的基于簡單結構的閾值策略有完全共享策略[4-5]、完全區分策略[6-7]、資源預留策略[8-9]、自適應閾值策略[10]等。相對于基于閾值的接入控制方法,基于隨機優化的接入控制著重于通過隨機模型來描述系統狀態在網絡系統接入控制過程中的動態演化,并通過策略優化算法對系統接入控制進行優化。文獻[11]為資源共享系統設計了一種基于Markov決策過程(Markov Decision Process, MDP)模型的接入控制方案,用于分析和求解具有多個級別服務的系統的接入控制策略。基于隨機優化的方法在對網絡系統接入控制過程的描述上更為準確,并且得到的接入控制策略也更為精細。
在傳統的網絡中,在網絡層上采用盡力而為的服務方式,沒有考慮不穩定的網絡狀態和網絡擁塞對視頻傳輸質量以及用戶服務質量造成的影響[12]。軟件定義網絡(Software Defined Network, SDN)作為一種可以克服上述缺陷的新型網絡系統架構,已經成為研究熱點。SDN將網絡控制平面從傳統的分布式網絡設備中獨立出來,使得網絡管理員能夠通過在控制器上編制軟件來靈活地控制和部署網絡功能,實現了網絡的可編程性。在基于SDN的媒體分發網絡中,可以通過SDN控制器來控制網絡層視頻流的路徑選擇,從而降低視頻傳輸時延,提高服務質量[13]。文獻[14]提出一種基于SDN的內容分發方案,該方案采用基于名稱的路由和緩存技術來進行流量管理,并根據網絡狀態動態選擇、修改內容傳輸路徑,從而提高內容分發效率。文獻[15]為視頻供應商提出一種采用OpenFlow組播技術的內容分發方案,該方案根據當前網絡狀態動態地重構組播樹,并通過修剪擁塞鏈路對應的組播樹分支,來有效地減少網絡資源浪費。然而上述已有文獻并沒有對此類系統的接入控制問題進行探討,為了進一步提高系統資源利用率和用戶的服務質量,本文對基于SDN的媒體分發網絡的接入控制問題進行研究。而傳統媒體分發網絡的接入控制方案只在應用層上考慮優化服務節點服務性能,而沒有考慮網絡層上傳輸鏈路的優化問題,因此,在研究基于SDN的媒體分發網絡的接入控制問題時,采用上述方法已經不合時宜。
本文認為在研究基于SDN的媒體分發網絡的接入控制問題時,應該充分利用SDN系統架構的優勢和特點,不僅要考慮應用層上服務節點存在性能瓶頸;同時還應該考慮網絡層上鏈路擁塞對數據傳輸質量和用戶服務質量造成的影響。為此,利用SDN控制器對網絡的管理和控制能力,在獲取服務節點的資源分配和服務狀況信息的同時,獲取網絡中數據傳輸路徑上的資源使用情況(如可用服務帶寬等),為基于SDN的媒體分發網絡系統提出了一種綜合考慮應用層和網絡層優化問題的接入控制方法。該接入控制方法一方面優化應用層上服務節點的服務性能;另一方面優化網絡層上傳輸鏈路的服務性能,在有效利用系統資源的同時,提高了系統性能。此外,在傳統的接入控制方案中,決策時僅考慮是否接入,接入后的節點選擇依賴于源選擇策略,如Benchmark策略等[16],本文在構建系統模型時,將節點選擇和鏈路選擇融合到行動空間中,通過策略梯度優化算法,求解出使得系統性能達到最優的接入控制策略。
1基于SDN的媒體分發網絡
首先介紹基于SDN的媒體分發網絡的基本組成部分、相應的功能和相互之間的協作關系,在此基礎上再討論該系統的接入控制過程。
圖1給出了基于SDN的媒體分發網絡的系統架構。與傳統媒體分發網絡相比,基于SDN的媒體分發網絡通過運行在高性能服務器上的SDN控制器加強了對整個網絡的控制和管理,其中SDN控制器可以查看整個網絡的狀態信息,克服了傳統媒體分發網絡中邊緣服務節點的局限性,因此基于SDN的媒體分發網絡可以更好地進行全局優化,如流量工程、負載均衡等,并且集中式的管理框架使得管理大大簡化。其次,在SDN中無需在網絡邊緣部署昂貴的邊緣代理服務器,取而代之的是以分布式部署的可編程存儲路由器,其中的可編程存儲路由器是帶有存儲功能的,并以OpenFlow協議運行的路由器,由SDN控制器控制和配置。用戶無需向距離較遠的邊緣服務器請求資源,SDN方案允許用戶向距離更近的可編程存儲路由器獲取請求資源,這可以顯著縮短資源傳輸距離,減少網絡故障等不穩定因素的影響,從而提高視頻服務質量和用戶體驗質量。流媒體服務器主要負責新資源的分發,可編程存儲路由器在SDN控制器的作用下,周期地請求和接受來自源服務器的新資源。
圖片
圖1基于SDN的媒體分發網絡
當系統中某個服務節點接收到一個來自用戶的服務請求后,該系統的接入控制過程就開始了,圖2給出了這個接入控制過程的控制結構。首先,用戶向網絡邊緣的服務節點i發送關于資源k的服務請求,本地服務節點i將該服務請求轉發給區域SDN控制器,該控制器會根據請求類型、系統狀態和接入控制策略決定是否接入此請求。如果決策結果是接入請求,控制器一方面會根據本地服務節點i和部分其他服務節點的服務狀態和資源分配情況,決定是由本地節點直接向用戶提供服務,或是向其他服務節點j發送資源k的數據調度請求,數據調度的目的是由其他服務節點向本地節點i推送所需資源k;另一方面根據本地節點i到用戶之間各條鏈路上的服務資源和負載情況,選擇本地節點i下的一條鏈路完成到用戶的資源傳輸。
圖片
圖2一個服務節點處的接入控制過程
當一個服務節點收到來自其他節點的數據調度請求后,不必對其是否接入進行決策,而是需要直接為該請求提供服務。然而,如果此服務節點處沒有足夠資源為這個請求提供服務時,為了保證正在被服務的其他用戶請求的服務質量,服務節點會放棄為這個請求提供服務。同樣在選擇傳輸鏈路時,如果鏈路服務能力達到上限,為了保證其他正在接收資源的用戶服務質量,傳輸鏈路會拒絕進行該數據傳輸。當一個請求所需的服務完成時,此請求所占用的系統資源也會隨之釋放;同時考慮到該系統中服務節點是可編程存儲路由器,其存儲空間有限,為了滿足不同用戶的不同資源請求,可以假設本地節點接收到的來自其他節點推送的資源,在服務完成用戶請求后會被釋放,即節點存儲矩陣在系統更新資源前保持不變。
2基于POMDP的接入控制模型
MDP常用于解決接入控制問題,但MDP方法面臨著狀態空間過大導致的維數災問題[17],由MDP擴展的部分可觀Markov決策過程(Partially Observable Markov Decision Process, POMDP)可以基于觀測采取決策,能夠有效地解決MDP維數災問題,因此,本文通過POMDP對基于SDN的媒體分發網絡的接入控制進行建模,并通過策略梯度優化算法求解最優接入策略。
在研究基于SDN的媒體分發網絡的接入控制問題時,可以作如下假設:根據視頻源服務器更新可編程存儲路由器中存儲資源的時間間隔較長,可以假設服務節點的存儲信息不變,即存儲矩陣不變;不同服務節點可以提供的服務種類是不一樣的;由于SDN控制器對網絡具有集中管控能力,可以為用戶選擇最短路徑來傳輸資源,因此可以假設每個用戶都是通過最短路徑向服務節點發送資源請求;當收到用戶請求的服務節點即本地服務節點沒有請求所需的資源時,需要通過數據調度從別的服務節點將所需資源推送到本地節點,再由本地節點向用戶提供服務;用戶只能通過本地節點下的鏈路接收資源,這是因為在實際系統中,服務節點無法直接向所有用戶提供服務。
為了充分利用SDN控制器對路由器的直接管控和全網感知能力,本文在對系統進行POMDP建模時綜合考慮了服務節點和傳輸鏈路的性能優化問題。以服務用戶數作為系統狀態參數來反映服務節點和傳輸鏈路的負載,以節點選擇和鏈路選擇作為決策行動,并定義用戶的請求到達和服務完成作為觀測事件,進而可以計算出狀態之間的轉移概率和產生觀測的概率,在模型構建完成后,通過策略梯度算法對接入控制策略進行優化。由于以系統長期運行得到的平均報酬作為衡量系統性能的準則,從而求解出的最優策略可以提高系統運營收益,對服務節點性能優化的同時,通過為用戶選擇傳輸鏈路,減少了鏈路擁塞對數據傳輸質量和用戶服務質量造成的影響,并改善用戶的服務體驗,減少系統資源的浪費。
在對基于SDN的媒體分發網絡的接入控制建模之前,首先給出系統的一些主要參數及描述。在基于SDN的媒體分發網絡中,用戶可以請求的資源種類數為K,K種資源存儲在N個可編程存儲路由器中,即系統中服務節點數為N;用Vi表示節點i處的服務連接數上限,當節點i的服務連接數等于Vi時,拒絕其他接入的請求;Li表示服務節點i下向用戶進行資源傳輸的鏈路數,所有服務節點到用戶之間用于資源傳輸的鏈路數總數為L,滿足L=L1∪L2∪…∪LN;用Bli表示節點i下鏈路l上可用于資源傳輸的服務帶寬上限,當該鏈路上已消耗的服務帶寬等于Bli時,拒絕其他的資源傳輸請求;bk表示向用戶提供第k種資源服務所消耗的服務帶寬;假設用戶請求到達服從泊松分布,用λilik表示節點i收到來自鏈路li關于資源k的請求到達率;假設用戶服務時間服從指數分布,用μk表示關于資源k的服務率。
根據上述討論與假設,接入控制的POMDP模型可以描述如下。
2.1狀態空間
2.2觀測空間
2.4狀態轉移概率
3優化算法與仿真
3.1梯度優化算法
3.2仿真實例
假設一個基于SDN的媒體分發網絡系統可以向用戶提供4種資源服務,并存儲在3個可編程存儲路由器中,即該系統中服務節點數為3,并假設每個服務節點下各有3條鏈路可以進行資源傳輸,資源在各個節點的分布情況由存儲矩陣D決定,下面給出系統仿真參數取值,如表1所示。
在仿真優化初始階段,由于系統資源消耗較少,本文選擇盡力而為的服務策略作為起始策略,該策略一方面使服務節點盡可能大地接入用戶的資源請求;另一方面,選擇最短傳輸鏈路作為服務節點向用戶推送資源的路徑選擇策略。起始策略在系統負載較低的情況下,可以為用戶提供良好的服務質量,但隨著系統內服務用戶數的增加,由于沒有考慮節點和傳輸鏈路的負載情況以及對用戶造成的服務延時,會導致系統整體負擔較大,在極大浪費系統資源的同時,使用戶得到較差的體驗質量。
在選定初始策略的基礎上,使用策略梯度優化算法進行策略迭代,由于選取系統長期運行得到的平均報酬作為系統性能測度,優化目標是求出最優策略使其最大,為了觀測系統性能的變化情況,繪制出系統性能在迭代過程中的變化曲線,如圖3所示。從圖3可以看出,隨著迭代次數的增加,接入控制策略不斷進行更新,系統性能也隨之顯著提升,并最終在最優策略下系統性能達到最優。表2給出兩種不同策略下的系統性能對比數據,將基于POMDP的最優策略與盡力而為策略作對比,發現最優策略下的系統性能明顯優于盡力而為策略,性能提升約10%,驗證了本文所提出的綜合優化應用層服務節點和網絡層傳輸鏈路服務性能的接入控制方案,在有效利用系統資源的同時,提高了系統的性能。
本文進一步研究到達率對策略梯度優化算法的影響,分別在低到達率λ2和高到達率λ3的情況下,觀測系統性能隨迭代次數增加的變化情況,其中λ2和λ3的取值如下,最終實驗仿真結果如圖4所示。
由圖4可知,不論是在低到達率還是高到達率下,策略梯度優化算法都非常有效,接入控制策略的系統性能均隨著迭代次數的增加逐漸升高,并在迭代結束后的最優策略下達到最優。系統性能的顯著提升意味著與盡力而為策略相比,媒體服務提供商采用最優策略作為接入控制策略將得到更高的收益,從而提高了系統的運營能力。
4結語
本文對基于SDN的媒體分發網絡的接入控制問題進行研究,在傳統接入控制方案的基礎上,結合SDN系統架構的特點,提出了一種綜合考慮應用層和網絡層優化問題的接入控制方案。該方案一方面優化應用層上服務節點的服務性能;另一方面優化網絡層上服務節點到用戶之間的傳輸鏈路的服務性能,減少鏈路擁塞對數據傳輸和用戶服務質量的影響。本文利用POMDP對系統的接入控制進行建模,并采用策略梯度優化算法求解出最優策略。最后,通過仿真實驗驗證了模型的有效性及優勢。
【基于軟件定義網絡的媒體分發網絡的接入控制論文】相關文章:
基于NNVD的網絡化軟件多步控制算法研究10-26
淺析基于網絡的多媒體教學設備中央控制及管理系統的設計與實現09-01
基于策略的網絡管理技術論文07-01
網絡接入技術的分類及應用09-04
網絡媒體對旅游產業的作用論文09-16
基于社會網絡的信息傳播度量模型論文08-26
一種基于網絡的監控軟件設計與實現07-20
無線接入在網絡融合中的應用08-28
網絡融合中無線接入的應用分析06-11