- 相關推薦
可自主識別出圖片中對象:神經網絡獲新突破
引導語:神經網絡獲新突破:可自主識別出圖片中對象,在神經網絡將圖片分解為單獨元素之后,歸類和識別對象就變得更容易,因為這些對象不會相互重疊,導致圖像模糊不清。下面我們來看一下具體內容。
據外媒報道,利用神經生物學方法,芬蘭計算機科學家正在人工智能研究的過程中取得新突破:深度學習神經網絡可以自主識別出圖片中的對象,準確率達到了75%。
人腦非常奇妙。在幾十年研究之后,人類仍然無法復制出人腦的超快計算速度。目前,計算機科學家可以利用的最強大工具是神經網絡。這樣的大型計算機網絡能通過訓練去解決復雜問題,而機制類似于人類的中樞神經系統,即利用不同層次的神經元解決問題的不同部分,最終合并為適當的答案。
目前的問題在于,這樣的神經網絡需要大量數據輸入和訓練,隨后才能學會如何解決問題。例如,ImageNet是個很好的訓練數據源,這一龐大的可視化信息數據庫中包含100萬張經過人工標注的照片。
這被稱作“監督學習”,而真正的人工智能意味著,神經網絡需要學會如何自動完成“無監督學習”。這正是芬蘭創業公司Curious AI希望實現的目標。
Curious AI首席技術官安迪·拉斯姆斯(Antti Rasmus)在赫爾辛基的Slush 2016科技行業大會上表示:“人腦會進行大量的無監督學習。我們不需要反復告訴嬰兒,勺子是什么。他們可以自動從環境中學習,并形成概念。”
“對人腦來說,根據某一對象形成概念很簡單。這已在心理學中得到了研究,即‘格式塔理論’。人腦會將具備類似形狀、顏色、運動狀態和模式的東西歸類在一起。我們采取的第一步是讓深度學習系統能像人腦一樣,對對象進行歸類。”
將神經科學應用于人工神經網絡
在神經科學中,名為“速率編碼”的理論認為,大腦中神經元的激發速率越高,神經元就越活躍。神經元持續被激發。而80年代時,科學家發現,神經元會將自身組織在一起,代表不同的信息。
這一理論被稱作“臨時編碼”。理論認為,神經元的激發時機很重要,而準確的激發時機定義了,在數萬神經元中哪些神經元屬于同一群體。因此,一部分神經元可以同時激發,幫助大腦識別一系列對象中的某個對象,例如一堆辦公用品中的一塊紅布,而另一部分神經元會告知大腦,其他對象都屬于背景信息。
拉斯姆斯表示:“我們的計算機算法集成了臨時編碼機制。我們在神經網絡的每層中保存多個拷貝。整個神經網絡被復制了4次。這意味著系統可以學習得知,每個拷貝代表了某個特定對象,而將這些對象合并在一起,就可以與原始圖像進行匹配。”拉斯姆斯此前曾是英偉達的軟件工程師,目前正在芬蘭阿爾托大學從事深度學習的博士研究工作。
“通過將圖像分為不同的4組,神經網絡可以自行編碼圖像。這就是無監督學習,我們不用對系統進行任何標記。當我們向神經網絡展示圖片時,它會將圖片自主分解成為元素(例如圖片中的對象)。”
在神經網絡將圖片分解為單獨元素之后,歸類和識別對象就變得更容易,因為這些對象不會相互重疊,導致圖像模糊不清。
知覺分組可以給深度學習帶來變革
研究人員最初指導神經網絡在無監督的情況下分析圖片,組織對象,隨后向圖像加入標記信息(監督學習),從而觀察系統究竟學會了什么。他們發現,Curious AI的Tagger系統能實現75.1%的準確率。
作為對比,傳統神經網絡的準確率只有21%,比隨機猜測的準確率僅僅高出1%。
拉斯姆斯表示:“這是革命性的研究,這使得無監督學習獲得了進一步發展。通過讓機器獲得對象的概念,我們實現了更類似人腦的無監督學習。這可以幫助未來的研究,讓神經網絡進行更高層次的推理,學習對象與環境的相關性。”
“在當前系統中,計算機運行在基于統計的世界觀中。如果讓計算機進入人類生活的世界,那么非常重要的一點是讓機器以類似人類的方式去理解世界。人們通常很難理解計算機視覺的效果很差,因為人眼視覺對我們來說很自然。”
該公司的相應論文《Tagger:深度無監督知覺分組》將于12月7日在巴塞羅那的“神經信息處理系統2016”深度學習大會上發表。
Curious AI正在尋找工業界的合作伙伴,在現實世界的人工智能系統中試點其深度學習技術。目前,該公司正與希望發展無人駕駛技術的汽車廠商進行接觸。
【可自主識別出圖片中對象:神經網絡獲新突破】相關文章:
公司章程可自主約定的事項11-15
小型超市賣蔬菜有利可圖03-18
青海大學生自主創業可貸款10萬02-26
大學生自主創業最高可貸100萬03-11
青島:大學生自主創業最高可貸20萬03-26
晉城:婦女自主創業最高可貸8萬元03-23
重慶畢業生自主創業最高可貸8萬03-26
天津:在校生自主創業可保留2年學籍02-26
貴州息烽鼓勵自主創業 可貸20萬創業基金03-09
石家莊大學生自主創業可減免稅收02-28