Top
首頁 > 正文

數字視網膜成為“城市大腦”破除“自閉癥”的下一站

85%到90%的城市數據是監控視頻數據,超大數據量卻有著超低價值密度。所以當前的城市大腦架構下就容易患“自閉癥”和“癲癇”。而借助數字視網膜的三個特征,我們不僅能優化城市大腦,還能為智能交通提供更好的解決方案。
發布時間:2019-11-25 15:14        來源:賽迪網        作者:王昊

【賽迪網訊】11月19-20日,以“動能煥新·智慧融合”為主題的世界人工智能融合發展大會在山東濟南隆重召開。中國工程院院士、新一代人工智能產業技術創新戰略聯盟理事長高文在主題為《智能交通與數字視網膜》的報告中指出,85%到90%的城市數據是監控視頻數據,超大數據量卻有著超低價值密度。所以當前的城市大腦架構下就容易患“自閉癥”和“癲癇”。而借助數字視網膜的三個特征,我們不僅能優化城市大腦,還能為智能交通提供更好的解決方案。

他指出,以智能交通之所以稱為“智能”為例,正是可以通過一些技術手段把原來效率較低的查詢路面車流量多少的工作提速,但是類似系統大部分是通過地面線圈、攝像頭采集到的信息作為輸入。而今天,將現代化的傳感器和計算系統融合之后可以把智能交通等城市大腦功能做得更好。

高文

中國工程院院士、新一代人工智能產業技術創新戰略聯盟理事長高文

 傳統城市大腦架構帶來的問題:超大數據量,超低價值密度

數字視網膜、圖像處理、視頻處理均是經過了長時間的演化路徑,比如最早的模擬的照相機,后來直到19世紀中葉左右,從倫敦開始逐漸利用這些圖像與傳輸的圖像內容借助計算機把模擬圖像變成數字圖像。

直到今天,這幾乎涵蓋所有可以用圖像處理的應用領域。并且在攝像頭價格下降、云計算加入以后,攝像機網絡誕生,可將幾千個、幾十萬個攝像頭連成一個網。后端則是城市大腦,即原來的云存儲。因此,城市內有若干個分存儲器和一個總中心,最后包括智能交通的所有的決策分析都需要在總中心進行。

高文從數據傳輸的過程解釋道,以前的模式是攝像頭捕捉的內容回傳,如果直接傳輸需要的帶寬太寬,費用太高,則用編碼器壓縮之后傳輸過來,接收方則再把它解碼,有價值特征內容提取后進行分析和識別。而特征提取和分析識別過程在人工智能火熱以后,現在基本都是以深度神經網絡進行。

從數理上看,只要擁有足夠的算力就可以完成的。因此,絕大多數城市大腦架構就變成中間的云架構,從最底層的存儲到中間層有數據交換的平臺、軟件平臺、算法平臺,算法平臺、服務平臺。

高文結合實例談道,存儲直接連接前端傳感器后會造成系統效率低下的問題。比如,公安、交通等部門的攝像機網絡很難實時使用。因為提取結果實時傳輸后,類似大規模的攝像機網絡的數據量雖然龐大,但是并不是大數據,很難形成對城市整體的規劃改進等有幫助的數據。這就是第一個問題——超大數據量。

另外,數據作為一種生產資料可以產生財富。但是城市監控的視頻數據卻除外。現在,城市中85%-90%數據都是監控視頻數據,但是真正對城市規劃、城市管理有所貢獻的少之又少。所以第二個問題則是超大數據量卻帶來了超低價值密度。

沒有價值的原因是什么,又該如何解決?原因其實就是架構問題。因為原來架構中的絕大多數攝像頭只是獲取、編碼,對后面數據發揮更多作用的貢獻微乎其微。因此,需要利用一些可以在攝像頭提取有用數據、傳輸到云平臺并進行處理、存儲、長期保存的技術手段,形成一個富有價值的大數據。

高文分析道,當前矛盾是攝像頭的工作過多或過少,99%左右不做特征提取的攝像頭只進行編碼、傳輸、存儲,而如果直接識別人臉、車牌號,其實貢獻也很小。從現有監控視頻的使用方法來看,一種是人工監控,依靠人工查看,最后定位具體事件。另一種是機器分析,可識別行為的目的和身份。高文繼續談道,現在機器分析通常演示效果尚好,而一旦前端不支持,完全憑云計算把數據解開再分析,則所需算力實在太大,難以實現。 

學習人類視網膜破解城市大腦“自閉癥”

人類雙眼工作效率非常高效,眼睛視網膜的細胞數和最后傳輸到大腦后與大腦工作的連接數的相比,會發現一個差值:細胞數是接收區的細胞數量的120多倍。

因此人類的視覺系統在信息傳輸時并不是一層直接傳輸的,而是經過若干層,逐層傳輸后逐層遞減,最終一直到腦神經處。以上的信息縮減功能在目前的攝像頭中并沒有。

高文認為,現有城市大腦的云架構系統則比較像病態的人類視覺系統。比如自閉癥、癲癇癥等由于神經發育過程出現問題而導致。從神經系統解釋,人類出生時末端神經和腦端神經幾乎是全連接,從嬰兒時期開始學習后,通過周邊刺激學會觀看世界、通過語言交互學會聽說,過程中就會對全連接進行增強和剪裁。正常情況下衰減、增強后發育為正常。但如果發育時沒有進行剪裁,長大以后就會患上自閉癥。

而癲癇則是剪裁過度,面對一般刺激就會形成放大的反應。現在,我們的城市大腦系統中如果攝像頭傳輸的內容沒有進行任何信息提取,就把每個攝像頭在系統里完全同等顯示,這就是一個“自閉癥系統”。如果有的攝像頭識別過于得過于重要,這種系統很容易變成“癲癇癥系統”。

因此,高文談道,面對現有城市大腦系統易于患上“自閉癥”或者“癲癇癥”的現狀,就需要有一個系統像人類視覺系統一樣,把信息匯總以后逐層縮減以后再傳輸。

數字視網膜“三流合一”

高文在分析數字視網膜最主要的八個特性時認為,也可匯總成三個本質特征:一個是全局統一的時空ID。每個攝像頭要設定一個全局統一時空的ID。每個攝像頭只要回傳就可知道在全局統一時空下是幾點幾分發生的以及物理地點。

二是視網膜本身的高效視頻編碼能力,又分為高效特征編碼的能力和聯合優化的能力。高效視頻編碼是指可以應對諸如AVS標準、MPEG4等等不同標準。特征編碼是指面對MPEG、CDVS、CDVA等如需在一個碼流里同時監控視頻編碼和特征編碼的話,需要讓其可以聯合優化。

三是模型可更新、注意可調節、軟件可定義。模型可更新指的是特征提取的模型,現在的神經網絡模型會隨著時間推移出現新算法,因此要求數字視網膜的模型是可更新的。當前的數字視網膜芯片可以做到模型可更新、注意可調節,攝像頭的注意能力是可以后臺控制的。同一個畫面里,優先級不同,可以賦予其感興趣區域標識,具備注意功能,而其他背景區域并不重要可以較大壓縮。軟件可定義是指有些可以通過軟件升級的方式實現軟件可定義。

這種新的數字視網膜實際有三個流:視頻編碼流,特征編碼流,模型編碼流。

他指出,這三個流各有分工,有的是在前端實時控制調節,有的則是通過云端反饋進行調節和控制。而數字視網膜的應用過程也就通俗易懂了,即通過腦眼合一方式將來自終端的信息經過數字視網膜的處理后傳送到云端。也就是完全以這三個流傳入,有的流能看,有的流可以讓機器自動去處理,而且是可以升級、有不同注意的。

以深圳市的鵬程云腦為例,高文指出,現在其已經具備了100P的算力。之上也有開源內容,比如建立開源生態、使能技術。視頻編碼標準就是其中的重要使能技術。視頻編碼在某些最新芯片上已可以應用,比如海思已經出了第一款全新的視頻解碼芯片。

高文最后介紹到,關于模型和模型的滲透壓縮也正處于標準化工作階段內。數字視網膜芯片的已經在路上,相信會很快發布。這個芯片大小類似一塊錢硬幣大小,包含以上的三個本質特征、八個功能,將來可能會直接植入包括智能交通系統在內的各種城市大腦系統中,支撐數字視網膜的應用。

數字視網膜憑借全局統一時空ID、高效的視頻編碼、高效的特征編碼、聯合優化等多層次的視網膜表達的特征優勢,另外結合模型可更新、注意可調節、軟件可定義的聯合特征,最終和使能技術、硬件和云的工作協作后,相信可以為智能交通、城市大腦提供優化解決方案。

專題訪談

合作站點
stat
河南泳坛夺金奖金