標準是社會高質量發(fā)展的重要技術支撐。黨的二十大報告明確指出,穩(wěn)步擴大規(guī)則、規(guī)制、管理、標準等制度型開放。
近日,由鵬城實驗室牽頭制定的全球首個端邊云協(xié)同技術的國際標準——數(shù)字視網(wǎng)膜系統(tǒng)國際標準(以下簡稱標準)正式發(fā)布,標志著我國在該領域的標準工作取得重大突破。
標準的主要科研領軍人之一、鵬城實驗室智能部視覺所所長王耀威告訴記者,相較現(xiàn)有的其他產(chǎn)業(yè)應用標準,該標準具有三大優(yōu)勢:可調(diào)節(jié)注意力,能夠挖掘低密度的數(shù)據(jù)價值;軟件可定義,充分優(yōu)化了整個傳感基礎設施的靈活性;隱私保護,有效彌補了現(xiàn)行標準在隱私保護方面的欠缺。
著力破解超大城市海量視頻數(shù)據(jù)處理難題
隨著近年來城市規(guī)模的擴張與需求的復雜化,超大城市在公共安全與交通治理上迎來了巨大挑戰(zhàn)。傳統(tǒng)的視覺感知系統(tǒng)已無法滿足城市海量視頻數(shù)據(jù)的處理分析需求,難以支撐城市治理應用。
“例如,傳統(tǒng)監(jiān)控攝像頭為‘一對一’模式,在此模式下,海量高清視頻數(shù)據(jù)的傳輸對系統(tǒng)帶寬帶來很大壓力,極大影響了城市治理效率!蓖跻硎。
為著力破解超大城市海量視頻數(shù)據(jù)處理難題,鵬城實驗室主任、中國工程院院士高文率先提出數(shù)字視網(wǎng)膜這一重要概念。他強調(diào)在攝像頭中嵌入芯片,將攝像頭獲取的視覺數(shù)據(jù)經(jīng)過高效編碼和緊湊特征提取后,傳送給“城市大腦”,以便更為高效、靈活地檢索和分析。
基于此,鵬城實驗室成立團隊開展研究,并在原有的“視頻編碼流+特征編碼流”的“雙流”模式基礎上,進一步提出了“三流”模式,創(chuàng)新性地增加了模型更新流,大大加強了該系統(tǒng)應對城市治理等復雜環(huán)境的能力。
通過視頻流、特征流、模型流的高效協(xié)作,團隊自主研發(fā)的數(shù)字視網(wǎng)膜系統(tǒng)實現(xiàn)海量視覺數(shù)據(jù)的實時處理和時空大數(shù)據(jù)的分析與挖掘。
“我們提出的數(shù)字視網(wǎng)膜標準體系正是基于對數(shù)字視網(wǎng)膜系統(tǒng)的研究!蓖跻硎荆摌藴鼠w系包含12個板塊,此次發(fā)布的國際標準是首個板塊“總體架構”,完整定義了數(shù)字視網(wǎng)膜系統(tǒng)的整體框架。
服務全球人工智能技術與產(chǎn)業(yè)發(fā)展
值得一提的是,該標準提出了“特征實時匯聚、視頻按需調(diào)取、模型在線更新”的視覺計算系統(tǒng)新范式,既降低了系統(tǒng)內(nèi)數(shù)據(jù)傳輸壓力,又緩解了云上的集中計算壓力,且模型可更新、功能可定義的技術特性能夠靈活支撐各種應用,實現(xiàn)對視覺大數(shù)據(jù)的實時分析和處理,解決了傳統(tǒng)視覺系統(tǒng)在帶寬、計算、存儲等方面的資源瓶頸。
研發(fā)過程中,因端邊云協(xié)同涉及的供應商眾多,且技術創(chuàng)新和產(chǎn)業(yè)需求之間存在錯位,這套標準體系的建設困難重重。
為解決互聯(lián)互通問題,鵬城實驗室綜合考慮全球學術界和國內(nèi)外廠商的意見,基于不同技術形態(tài),從技術和行業(yè)發(fā)展趨勢的角度引導各個廠家形成統(tǒng)一的技術框架;為應對需求錯位的問題,對數(shù)字視網(wǎng)膜系統(tǒng)開展了多個應用試點。
2022年初,鵬城實驗室聯(lián)合產(chǎn)業(yè)合作單位成立了數(shù)字視網(wǎng)膜標準工作組,正式開啟了數(shù)字視網(wǎng)膜系統(tǒng)的國際化進程。歷經(jīng)多輪優(yōu)化完善,系列國際標準的第一部分終于順利發(fā)布。
目前,鵬城實驗室已與多個產(chǎn)業(yè)龍頭企業(yè)合作,將基于數(shù)字視網(wǎng)膜的大規(guī)模視頻智能處理技術賦能智慧城市應用,在智能交通領域初步構建了應用生態(tài),相關技術已推廣至武漢、長沙、西安等數(shù)十個大中城市和地區(qū)的智能交通、智慧安防等建設項目中。
高文表示,鵬城實驗室將加速推進數(shù)字視網(wǎng)膜系列標準的建設,打通從研發(fā)、生產(chǎn)、測試到應用的全過程,為推動產(chǎn)業(yè)鏈、供應鏈、價值鏈、創(chuàng)新鏈深度融合提供堅實的標準支撐,服務全球人工智能技術和產(chǎn)業(yè)的發(fā)展。