賦予應用場景“看”的能力 深視光點3D機器視覺晶片研發之路


集微網報道,在人工智慧、機器人、無人機、物聯網等產業的帶動下,機器視覺技術受到了廣泛的關注。近年來,隨著應用場景的不斷升級,傳統的2D機器視覺技術也正向3D機器視覺技術邁進。南京深視光點科技有限公司(以下簡稱深視光點)抓住了這一行業大趨勢,開啟了3D機器視覺晶片的研發之路。


大有可為的雙目視覺技術

人為什麼能夠感知世界?深視光點創始人兼CEO薛樂山在接受愛集微採訪時給出了他的答案:“人類靠眼、耳、鼻、舌、身、意這‘六識’來感知世界,倘若缺少其中某一個,便會對這個世界的感知產生很大的偏差。”

深視光點正在做的事情便是賦予應用場景“看”的能力。薛樂山認為,傳統的2D機器視覺技術有一定的侷限性。他舉了一個簡單的例子加以說明,以兩個大小不一樣的圓球為例,在擺放成固定的角度時,2D技術會產生兩個圓球大小一致的誤判,如果用3D技術感知就可以避免類似問題的發生。

那麼雙目視覺演算法是否是實現3D感知的唯一技術路徑?薛樂山指出,結構光、ToF、鐳射雷達、雙目等各項技術一定是各有所長也各有所限,不過目前看來雙目是彈性最大的技術,且雙目的成本較低,可被廣泛應用。

具體而言,結構光、ToF、鐳射雷達採用主動光技術,無論周圍環境如何,都需要主動打出各自技術所需的特殊光,再讀取後才能夠有效地產生三維資訊,但只要主動發射光源就不可避免地會面臨耗電和發熱的問題,裝置的壽命也會因為而降低。而採用被動光技術的雙目便可以克服這一問題。

另外,薛樂山表示:“單一感測技術都有著各自的侷限性,高維度演算法融合是未來發展趨勢。雙目視覺演算法以不可替代的技術優勢成為演算法融合的基礎,其高複雜的演算法在融合時也呈現了絕對的優越性。”

從行業背景來看,3D機器視覺市場前景廣闊且增長迅速。以最近爆火的“元宇宙”為例,據統計,2020 年全球VR使用者數量已超過千萬,到2025年將達到9000萬,蘋果等巨頭的相繼入場給市場更大想象力空間。

不過與此同時,空間感測、功耗、內容生態是後續機器視覺市場發展的重要節點也是痛點所在,雙目視覺技術可獲得完整的二維彩色影象資訊及多元的三維資訊,從而解決行業痛點。

各司其職的複合型團隊

技術以及產品的研發離不開優秀團隊的努力,深視光點的團隊橫跨了3D機器視覺晶片所需的光學、演算法、晶片、軟體、應用多個領域,擁有高等演算法研發及轉化為晶片的能力及多領域複合鏈整理能力。該公司的團隊成員大多是機器視覺行業的資深人士,擁有15~30年的工作經驗。

創始人兼CEO薛樂山有20年美國NASDAQ及中國臺灣地區上市公司系統產品及數字晶片產品市場商務開發經驗和專案管理經驗。而他在雙目景深晶片行業10年的工作經驗也為他日後創業打下了堅實的基礎。

薛樂山曾任相關單位負責人,帶領市場營銷、演算法研發、晶片開發、產品銷售、系統工程及客戶工程支援等一線團隊,並帶領團隊開發出全球第一個量產3D雙目視覺晶片。他負責過的影像演算法晶片出貨總量超過五千萬顆,產品也成功匯入Amazon Go無人商店 & Facebook /Oculus /VALVE VR產品線,完成晶片量產落地。

延伸閱讀  31.55噸!河南發現特大金礦,價值116億,這會導致金價暴跌嗎?

當談及選擇回中國大陸創業的原因時,薛樂山表示:“在臺灣地區的上市公司一直呆下去似乎也是個不錯的選擇,但內心總感覺還有別的追求。當時我也在思考在什麼樣的土壤中更容易產生結果,最終還是決定回到中國大陸。儘管後來出現了中美關係惡化、疫情等不可控因素,但對初創企業來說,大陸的硬科技創業環境及廣闊的市場優勢依舊存在。”

CTO王振爵博士畢業於德國慕尼黑大學博士,有30年微波/雷達/天線/通訊設計及開發經驗,擅長客製化產品規格議定、開發設計及系統整合規劃,曾任職鴻海富士康、宇智網通等擔任總工程師/CTO,服務過Nokia、Motolora、Csico、華為、中國移動等一線客戶。主要負責在現有的實時三維點雲基礎上,疊加上毫米波雷達的資訊,以完成多維度視覺感測資訊融合。

未來可期的3D視覺市場

在雙目視覺演算法和複合型團隊的加持下,深視光點研發的3D視覺晶片目前已經實現全球最高解析度實時深度/點雲演算法,解析度可達1920×1080,深度圖幀速率最高可達240 幀/秒,遠高於市場同類產品且具價格優勢,與阿里等合作方已有部分應用開發成果。

目前該款晶片已接近完成開發驗證,即將進入流片工程(28nm製程)階段。深視光點正尋求Pre-A輪融資,以支援產品的量產。

與此同時,深視光點在與一流合作方應用開發方面碩果累累。在雙/多目動態結構光融合高精度三維重建領域,該公司已與電商龍頭企業合作針對人體及柔性商品的高精度三維還原重建。初期旨在解決客戶的線上購物後,因產品不合身所發生的退貨問題,中長期旨在升級成智慧製造生產裝置,以快速三維物件重建來完善少量多樣的設計和製造流程。

深視光點的三維視覺演算法已經應用於鍵盤的工業檢測領域,已與兩家客戶啟動高精度三維工業檢測合作專案,協助流水線提高效率及質量。目前檢測方案可達 0.1mm的Z值檢測,可大幅提高PCBA元件上品質辨別及鍵盤鍵帽組裝高度差的驗證分析效果。

延伸閱讀  比美國樣品年輕10億年!嫦娥五號樣品含有重要物質,研究早已開始

另外,深視光點也在異質演算法融合(雙目+毫米波雷達)研發持續發力。各式影像為基礎的三維感測技術路徑,都是以光波段的畫素感測為基本條件,當光的穿透受阻而無法提供有效資訊時,譬如在戶外可能會遇到的雨雪霧霾,所有利用光波段的感測技術都無法有效運作。另外是對光不會產生反射資訊的全透明玻璃,對所有的光波段感測技術都會產生誤判。就需與其它非光波段技術融合以取得不同維度的有效資訊。據薛樂山介紹,雙目及毫米波雷達能夠完美的互補彼此技術上的缺點,形成完整的多維度感測資訊從而給各種落地場景提供更完整的感測資訊來執行各種複雜場景應用。

展望未來,薛樂山表示,3D視覺是一個推進所有應用場景升級的核心底層技術,因為它可以接入的市場非常廣闊,除了我們所熟知的機器人、無人機、自動駕駛、無人商店、VR/AR外,還有諸如智慧化畜牧/農業等大家容易忽略的場景。

“當然,3D視覺技術未來會在哪些場景創造出商業價值,是許多人都提出過的大哉問,我可以大膽的說,它將無所不在。預測未來最好的方式就是創造未來,我們期待在創造未來的道路上,能找到更多對未來有熱情的夥伴和資源共同打造出一個意想不到的美好未來。”薛樂山最後說到。

(校對/木棉)

Scroll to Top