Facebook近日宣布開放Detectron,即該公司基于深度學習框架的計算機視覺對象檢測算法平臺。
Facebook近日宣布開放Detectron,即該公司基于深度學習框架的計算機視覺對象檢測算法平臺。該公司表示,開放項目的動機在于加速計算機視覺研究,Facebook團隊正在使用該平臺開發各種應用,包括增強現實技術。
在我最近的一篇文章中,詳細介紹了增強現實如今面臨的三大挑戰,其中的實時對象分類是最大的障礙之一:
要讓計算機視覺理解“杯子”的含義,而不是僅僅看到一個形狀,這是一個不容小覷的問題。所以這么多年來,我們在AR演示作品中總會看到人們把基準標記附加到對象身上,以實現更細致的追蹤和交互。為什么會如此困難呢?第一個挑戰在于分類。杯子有數千種形狀、大小、顏色和紋理。有些杯子擁有特殊的屬性和特殊的用途(如燒杯),也就是說不同的杯子的使用場合和背景也有所不同。想象一下,編寫這么一個可以幫助計算機理解上述所有概念的算法是多大的挑戰。你也可以想象,編寫一個向計算機解釋杯子和碗之間區別的代碼是多么地困難。
該文章還指出,“深度學習”有可能是實時對象分類的其中一種解決方案——這種學習涉及“訓練”計算機去解讀它所看到的事物,而不是人工去編寫檢測程序。本周,Facebook已經正式開源了他們的對象檢測算法,這可能會加速能進行實時對象分類的系統的開發,從而讓增強現實發揮真正的功效。
如果沒有對特定環境進行預編程,與我們周圍世界進行交互的增強現實將需要對我們附近的情況有粗略了解。比方說,如果你正戴著一款AR眼鏡,你希望把烤箱的溫度投影到烤箱上方,同時在冰箱上方投影出已經快要吃完的食物,這時AR眼鏡將需要了解烤箱和冰箱的形狀。由于烤箱和冰箱涵蓋的形狀、樣式以及擺放位置都不盡相同,這將成為一項極具挑戰性的任務。
在深度學習算法的鏡頭下,對象分類是什么樣子的
Facebook的人工智能研究團隊與其他相關團隊一直在研究,如何利用深度學習來幫助計算機解決對象檢測的問題,而這一基于Caffe2深度學習框架的對象檢測算法就叫作Detectron。在正式托管至GitHub后,現在任何人都可以自行嘗試。Facebook希望,Detectron開源后能幫助世界各地的計算機視覺研究人員進行新的嘗試,并不斷改進最新的技術。
該項目的GitHub頁面上寫道:“Detectron旨在為對象檢測研究提供高質量、高性能的代碼庫。Detectron的設計十分靈活,能夠支持新研究的快速實施與評估。”
算法可以檢測視頻輸入,并能夠猜測出構成場景的離散對象。“檢測和識別人類與物體的交互作用 (Gkioxari et al)”等研究項目已經在使用Detectron了,并以其為基礎來了解人類在特定環境中利用物體作出的行為。這是向正確的方向邁出的一步,以幫助計算機理解我們正在做的事情,從而能夠為忙碌的我們提供有價值的信息。
除了人工智能研究之外,Detectron還被用于Facebook的其他內部團隊;Facebook在Detectron的開源聲明中寫道:“各支團隊正在利用這個平臺來為各種應用進行定制模型訓練,其中也包括增強現實和社區完整性研究。”
目前尚不清楚具體是哪支團隊正在把Detectron用于增強現實,不過很可能就是Oculus。早在F8大會期間,Oculus的首席科學家Michael Abrash就曾探討過,增強現實將如何并于何時徹底改變我們的生活。
文章編輯:CobiNet(寧波)
本公司專注于電訊配件,銅纜綜合布線系列領域產品研發生產超五類,六類,七類線,屏蔽模塊,配線架及相關模塊配件的研發和生產。
?2016-2019寧波科博通信技術有限公司版權所有浙ICP備16026074號