本體支持的視頻語義概念探測論文提綱
寫好論文提綱是寫好論文的關鍵的第一步,所以希望大家首先寫好論文提綱。
1 引言 視頻語義內容分析的目標是抽取視頻包含的高層語義內容,為用戶提供語義概念的視頻瀏覽、檢索服務,語義概念探測是實現這一目標的核心步驟,并成為近期視頻語義內容分析領域的重要研究方向。
以往的視頻概念探測主要采用基于內容的方法,即通過抽取概念具有的低層特征,學習某種關聯模型(基于規則的或是基于統計機器學習的),直接的、獨立的建立低層特征與概念之間的關聯,探測視頻概念。
基于規則的方法是在抽取特征的基礎上,對特征進行簡單或者復雜的閾值判定。這種關聯模型的缺點是閾值確定難、算法不魯棒,并且簡單的閾值判斷難以有效的表征概念具有的特征多樣性。因此,目前采用較多的是基于統計機器學習的關聯模型,即通過某個機器學習模型學習標注的樣本數據中低層特征與視頻概念之間的統計概率關聯模式,然后采用訓練好的機器學習模型對新的樣本進行識別,探測視頻概念。目前的研究表明,支持向量。
和最大熵模型(Maximum Entropy Model,簡稱MEM)是兩類較為有效的用于概念探測的機器學習模型。
但是,由于語義鴻溝的存在,低層特征和高層語義的關聯并不是一一對應。不同的視頻概念可能具有相似的低層特征,相同的視頻概念也可能具有完全不同的低層特征,基于內容的獨立概念探測方法難以克服這個問題。另一方面,視頻中的概念并不是獨立出現的,不同的概念總是同時出現在視頻幀序列中。顯然,不同概念的共現性將增加低層特征模式的復雜性,進而影響獨立的概念探測性能。但是,從另外一個角度思考,不同概念間的關系信息也為概念探測提供了重要的上下文信息,例如:包含“汽車”概念的視頻片段,具有很大的可能包含有“道路”概念。重要的是如何有效的建模和利用這些信息。
針對語義概念探測存在的困難,本文提出了本體支持的視頻語義概念探測方法。一方面通過定義中層語義以減小語義鴻溝,建立低層特征與高層語義關聯的橋梁;另一方面利用概念間的關系和上下文語境,在概念探測中加入語義線索,提高概念探測器的語義識別能力。
而本體作為合適的知識建模工具可以有效的描述視頻語義內容和建模領域知識,因此利用本體增強概念探測的語義表達和識別能力是必需的也是可行的。
2 本體支持的概念探測框架視頻內容跨越了低層感知特征、感知特征模式、簡單語義概念、復雜語義概念諸多層次,并不是簡單的特征層和語義層就能表示的;更為重要的是,這種層次結構建立了視頻內容從低層特征到高層語義的內在關聯過程,為跨越語義鴻溝提供了有效途徑。另一方面,視頻語義內容分析的本質就是各個層次內容的分析抽取和各個層次之間關聯的建立。
基于以上分析,定義感知概念和語義概念如下:
定義 1 感知概念 (Perception Concept)感知概念是視頻中特征相似、反復出現的感知特征模式的抽象。這里的低層感知特征模式指視頻流中具有相同視覺或聽覺特征模式的時序或空間分割,例如:具有相同顏色特征的區域、具有相同音頻特征的視頻片段等,是語義概念在低層感知特征空間中最基本的表征。
定義 2 語義概念 (Semantic Concept)語義概念對應視頻中的特定時間片段或空間區域。語義概念是用戶分析視頻內容時關心的基本概念;從低層特征上看,語義概念具有明顯的、容易區別的低層感知特征模式,能夠表現為一個感知概念或多個感知概念和其關系的組合。
在上述概念定義的基礎上,提出視頻領域知識本體和視頻概念擴展本體建模上下文信息和視頻低層特征與高層概念的關聯關系。
定義視頻領域知識本體(Video Knowledge Ontology,簡稱VKO)為一個二元組,表示視頻領域知識中的概念的集合和概念間關系的集合。概念表示為一個五元組:名稱、標簽、關系集、同義詞集、描述文本;概念間語義關系包括四類:Kind ? of 關系、Instance ? of關系、Part ? of 關系、Attribute ? of 關系。需要指出的是,在實際知識建模過程中,概念間的關系不限于上述定義幾種基本關系,可以根據目標領域的具體情況定義相應的關系。
其中,VLO (Video Linguistic Ontology),表示視頻概念擴展本體中的語言層本體,即視頻內容中的語言級概念和概念間關系的集合。這里的語言級概念對應于視頻內容層次結構模型中定義的視頻概念。
VPO(Video Perception Ontology),表示視頻概念擴展本體中的感知概念層本體,即視頻內容中感知特征層中蘊含的感知特征模式和其關系的集合。
語義概念的探測應該從兩個方面進行考慮。一方面是發現概念具有的低層特征模型,稱為特征匹配。感知概念的抽象和定義建立了低層特征和視頻概念兩個層次之間的中間語義,避免直接建立低層特征和視頻概念間的關聯,減小語義鴻溝問題帶來的影響。從低層特征角度看感知概念是低層特征模式的抽象,具有特征穩定性和一致性;從高層語義角度看,視頻概念總是表現為若干感知概念的組合,因此感知概念也具有一定的語義。因此,首先抽取視頻概念關聯的感知概念,然后從感知概念中抽取低層特征訓練統計機器學習模型,識別語義概念。
另一方面是建模并利用上下文信息增強概念探測方法的語義理解和識別能力,稱為上下文信息匹配。提出的視頻概念擴展本體的語言層定義了概念之間的關系,同時“概念描述”、“同義詞集”、“關聯概念”等概念描述屬性完整、準確的描述了概念包含的上下文信息。
同時,利用VOCR 和語音識別技術可以從視頻片段中抽取文本信息,這些文本信息中出現的概念術語為語義概念探測提供了語義線索,能夠增強概念探測的準確率。本文提出的本體支持的概念探測方法。
【本體支持的視頻語義概念探測論文提綱】相關文章:
論概念邏輯在知識組織中的應用論文提綱01-16
語義韻研究在英語詞匯教學中的應用論文提綱11-18
論文提綱格式-畢業論文提綱范例03-17
英國論文提綱11-30
論文詳細提綱11-14
論文 訪談提綱03-02
逃離 論文提綱02-26
陳設論文提綱11-17
設計論文提綱11-17
環境論文提綱11-17
- 相關推薦