計算機視覺交互技術在企業日常工作中的應用論文
摘要:在現代企業的新產品開發,市場調研數據分析報告等集體智力活動當中需要很多的可視化的展示與溝通工作。目前很多情況下企業往往是采用傳統的PPT方式進行,這些PPT中大部分動畫都是單向無實時交互的。隨著現代計算機視覺識別和交互技術的發展,可以設計更好的交互展示系統,幫助企業改善復雜問題的溝通。
關鍵詞:計算機技術;視覺識別技術;交互技術;會議展示;智能辦公環境
在日常的企業辦公管理活動中,有很多時候需要可視化地展示企業市場計劃、新產品設計、數據分析報告等。盡管這些活動所需要的材料在事前可以經由辦公自動化軟件處理,但處理結果卻很大程度上只能由靜態的PPT展示和說明。但很多時候,這些展示和說明往往是多個部門不同專業背景的人員參與,于是展示材料制作的水平和質量就很大程度上影響到了參與者對所展示內容的理解和吸收程度。很多復雜的問題或者設計的展示,如果能采用互動交互的方式展示,在很大程度上能夠幫助問題討論的參與者對所討論問題更好的理解。這一點在常規的教育過程中已經獲得了充分的證實,相關的數據和結果可以從多媒體教學的優勢的相關研究中得到。同樣,企業中很多方案的討論,數據分析報告的說明其實對于企業而言也是一個方案設計者或數據研究分析者對相關人員類似教學的過程。采用現有企業常規會議設備諸如投影儀、普通筆記本電腦、電腦攝像頭配合相應的計算機視覺識別程序,我們可以將交互的投影演示引入到企業日常的展示討論活動中,增強溝通效果,提高工作效率,并且在技術上同樣的識別交互的程序配合上相應的員工面部特征的數據庫,還能擴展延伸到考勤或門禁系統中提供更加智能化的辦公環境。對于以展示溝通為主的教育培訓企業,通過配合一般人臉數據特征,可以通過攝像頭捕捉現場視頻并識別其中人臉識別,記錄現場關注展示內容的人員的數量,作為日后教學效果的自然客觀的評估參考。
1目前辦公信息化中存在的問題
1.1會議演示文稿展示時多人交互型差
目前主流的演示文稿制作及展示軟件主要大多都集成在套裝的辦公軟件中,其中主要常見的種類分別是MicrosoftOffice系列中的PowerPoint、MacOS系統下的KeyNote、基于Linux操作系統的Openoffice中的Impress。它們主要的功能都是對輸入的文字、圖片聲音等多媒體進行編輯制作最后生成電腦上播放的多媒體幻燈片,盡管它們都具有強大的多媒體數據的處理能力,但最終制作的多媒體幻燈片在演示時都是“單向交互”的,即由播放者播放,而其中的內容及動畫按預先設計好的模式顯示。如果使用Adobe公司的Captivate或Authware這樣的多媒體交互制作軟件則會需要有專人進行操作,浪費大量的時間和精力,但如果是配置專門的多點觸摸屏幕,則一來屏幕尺寸有所限制,二來費用相對較高容易造成設備的浪費。
1.2傳統辦公考勤與門禁系統的弱勢
目前企業常規的門禁系統與日?记谙到y往往是分離的,兩個系統使用了各自獨立的軟硬件環境,其中門禁系統使用的是攝像監控設備采集信息并通過專人24小時值班,其主要職能僅僅是監控辦公環境的人員進出并記錄下相應的影像資料。而企業日常的考勤系統則要么采用人工簽到的方式,要么采用人工打卡或者指紋打卡方式。如果采用打卡方式管理則需要添置專門的打卡機,這些打卡機多數是獨立工作,對于員工的考勤則需要人工根據卡片記錄情況統計。無論是員工自身打卡或者是統計考勤都是人工完成,有時還會出現錯誤和疏漏,同時主要的問題還在于容易出現代人打卡等作假的情況。所以,在傳統的辦公考勤與門禁系統獨立的情況下,兩個系統各自記錄各自的相關數據,同時投入兩套不同的軟硬件環境,有時這樣的辦公環境的信息化反而沒有給人員帶來便利,而是增加一項打卡簽到的日常任務。
2對存在的部分問題的分析和討論
2.1傳統演示設備缺乏交互型功能
由于很長一段時間硬件以及軟件的條件約束,電腦的鍵盤、鼠標完成了95%以上的數據輸入工作,單一顯示功能的顯示器投影儀也成了最主要的信息輸出設備。所以常規軟件設計和開發時都是把鍵盤、鼠標、顯示器/投影儀的輸入輸出組合當做幾乎所有使用情況下的模式。但隨著觸摸屏與多點觸控硬件的出現,多點觸控、屏幕的直接交互輸入輸出操作成了未來發展的一個趨勢,并且相對普通鼠標和單一顯示功能的顯示器用戶交互體驗明顯提升,人機交互界面更友好直觀。但是對于普通辦公中使用的投影儀,由于其投影的目標位置情況多樣,如果一體化的設計制造具有交互功能的互動投影儀其成本要比普通投影儀更高,對于解決互動操作的問題經濟上不是最優的。而大面積的多點觸控屏幕由于設備體積和重量的因素無法在需要靈活移動的新產品推廣談判等活動中使用,如果只是企業自身辦公環境中做普通會議展示的效果改進,其投入產出的效率也不理想。
2.2基于傳統輸入輸出設備的開發
由于長期以來人機交互都是以鼠標鍵盤為主,所以絕大多數程序開發設計都只考慮這種單一的輸入方式。但對于目前多媒體數據增多的趨勢,這樣傳統的輸入輸出模式就存在著很多弊端,其中最明顯的是對于多媒體數據的采集就需要單獨使用設備,采集后再人工處理。而為了簡化系統設計的復雜度,很多管理信息系統的數據采集和錄入主要基于鍵盤鼠標的錄入,如果出現非鍵盤鼠標錄入的數據則被要求人工進行數據格式的轉換,所以從一個側面也反映出一些企業排斥信息化,因為原本帶來效率提升與管理便利的.信息系統,反而由于一些數據格式的錄入要求增加了人工勞動。如果直接使用現實當中的多媒體類的數據則系統又缺少相應轉換的功能。因為系統在考慮使用鍵盤鼠標錄入采集數據時已經默認了操作者來完成數據錄入前的標準化工作。但是實際上隨著現代計算機視覺以及人工智能、模式識別技術的發展和完善,過去無法識別的原始多媒體數據現在也可以由計算機識別并進行標準化的處理。
3運用計算機視覺技術改善人機交互
3.1低分辨率識別情況下改善會議演示交互效果
采用現代的計算機影像處理技術和方法,可以用普通的圖像采集設備配合程序識別影像當中的特定顏色區域的移動軌跡,并對軌跡做出判斷實現與計算機的交互。由于該識別只是需要識別圖像中的特定顏色的區域的運動,而非具體的形狀與細節,所以識別的難度相對不大,可以運用在會議的展示環境下,通過定位確定普通投影區域與特定顏色區域的位置關系,并通過圖形圖像的投影與變形運算,實現人與普通投影的交互。在環境背景比較清晰,圖像采集設備分辨率與色彩分辨比較靈敏的情況下還能更進一步對人體膚色和手的幾何特征進行識別,實現更加自然良好的人機互動交互,并且還能引入人工智能的模式識別算法,實現多人的互動交互,從而大大改善互動展示效果,實現更加人性化有效的溝通。特別在教育培訓行業,在現有普通硬件條件下能夠實現更加生動的教學講解演示,提高學生的課堂體驗激發更多興趣,改善教學效果。
3.2運用計算機視覺與模式識別技術整合企業門禁與考勤系統
應用計算機視覺技術配合相對高分辨率的識別與人像數據庫,企業可以采用現有的門禁系統的硬件設備配合相應的軟件實現門禁與考勤系統的整合,以此提高企業辦公環境的智能化人性化的效果,并對員工進行更加精細化的管理。重要的是,通過人機接口的改進改變以往服務信息系統的面貌,讓人在自然的環境下工作提高系統的人性化程度。同時整合門禁與考勤系統可以通過識別企業內部員工與外來人員加強辦公環境的管理,而且在硬件上可以利用現有的設備,軟件方面可以與前面提到的交互演示系統共用相同的圖形圖像處理內核,減少代碼的冗余降低系統復雜度提高可靠性。就目前的人像識別技術而言,已經在個人電腦的安全保護上得到了應用,所以在技術上是可行的,并且也有了實際應用的例子。將該技術移植到普通的門禁管理系統與考勤系統中,只需要解決接口的數據交換就能實現,并且隨著現代企業辦公環境的要求,應用該技術能大大提高企業的辦公環境的智能化程度,并且通過門禁系統提取的企業員工考勤信息更加自然和真實,能夠更加準確地掌握和管理企業員工的日常工作情況提高管理精度。
3.3具體實現方法與原理
為了能充分利用企業現有的硬件設備,并使得附加的程序簡單化,這里針對類似會議互動展示這樣不需要細節識別的情況采用的是顏色識別的方法,即統計場景中的圖像直方圖,然后探測直方圖上的變化,由于特定顏色的待識別區域的引入可以對整體直方圖的特定區域產生峰值的變化,并且通過反向的直方圖運算又可以確定特定區域的位置。而直方圖的運算屬于比較簡單的圖像運算處理所以能夠在很多圖像處理的開發工具中直接找到。并且對于細節識別要求比較高的人像的模式識別,采用以上的運算也能縮小待檢測區域的大小,提高識別效率,并且人的面部特征采用色識別也能很快找到特征點(眼睛、鼻孔、嘴唇、頭發以及頭像邊緣)。在前面通過色彩識別找到的檢測區域中,識別出特征點,并測量特征點的位置關系比例,進而在和數據庫中數據對比模式匹配找到最終結果。
4結語
在越南河內的機場,為了使乘客能在等待航班時有比較輕松的環境,在旅客的候機大廳專門安放了一臺具有互動功能的投影儀,并將互動內容投影在地面,乘客可以在候機時與地面上的互動投影交互,緩解候機帶來的單調乏味感。同樣我們可以把它引入到日常企業辦公會議或者是培訓教育類企業的日常教學中,運用現有的投影屏幕和現有的設備實現多人的在投影屏幕上的互動交互討論。而人像識別系統在單機上的應用也在很多商用筆記本電腦上得到了應用,在一些科研院所和高科技企業人像識別的門禁系統也被應用到了辦公環境當中,提高了辦公環境的智能化程度;將人像識別技術結合考勤系統則在教育行業能夠實現更為方便的考勤管理防止目前比較嚴重的代簽逃課等情況的發生。隨著現在對數據挖掘技術的研究,從日常情況采集到的數據積累到一定程度還能為今后分析員工/學生行為做出數據的積累。這里所討論和解決的問題主要只是集中在人機交互界面的一些改進,其實對于IT技術而言這只是一小部分,對于企業而言需要使用IT技術真正提高企業的工作效率還需要其他很多方面的配合和集成。
參考文獻:
[1]黎松,平西建,丁益洪.開放源代碼的計算機視覺類庫OpenCv的應用[J].計算機應用與軟件,2005,22(8).
[2]陳雪松.基于圖像勢能理論的特征提取方法研究[D].華中科技大學,2011.
[3]李超,許春耀,潘林,余輪.面向投影環境的計算機視覺交互信息獲取[J].電視技術,2013,37(11).
[4]王修暉,華煒,鮑虎軍.面向多投影顯示墻的手勢交互系統設計與實現[J].計算機輔助設計與圖形學學報,2007,19(3).
[5]張為中.多觸摸環境下的軟件交互方式研究[D].電子科技大學,2012.
【計算機視覺交互技術在企業日常工作中的應用論文】相關文章: