5月12日,北京市科學(xué)技術(shù)委員會(huì)、中關(guān)村科技園區(qū)管理委員會(huì)就《北京市促進(jìn)通用人工智能創(chuàng)新發(fā)展的若干措施(2023-2025年)(征求意見(jiàn)稿)》公開(kāi)征集意見(jiàn)。
《若干措施》針對(duì)加強(qiáng)算力資源統(tǒng)籌供給能力、提升高質(zhì)量數(shù)據(jù)要素供給能力、系統(tǒng)布局大模型技術(shù)體系持續(xù)探索通用人工智能路徑、推動(dòng)通用人工智能技術(shù)創(chuàng)新場(chǎng)景應(yīng)用、探索營(yíng)造包容審慎監(jiān)管環(huán)境五大方向,明確組織機(jī)制,提出21項(xiàng)具體措施。
(一)組織商業(yè)算力定向滿(mǎn)足本市緊迫需求。加強(qiáng)與頭部公有云廠商等市場(chǎng)主體合作,實(shí)施算力伙伴計(jì)劃,并確定首批伙伴計(jì)劃成員,明確供給技術(shù)標(biāo)準(zhǔn)、軟硬件服務(wù)要求、算力供給規(guī)模、優(yōu)惠策略等,向在京高校院所和中小企業(yè)公布一批優(yōu)質(zhì)算力供應(yīng)商。
(二)高效推動(dòng)新增算力基礎(chǔ)設(shè)施建設(shè)。將新增算力建設(shè)項(xiàng)目納入算力伙伴計(jì)劃,加快推動(dòng)海淀區(qū)“北京人工智能公共算力平臺(tái)”,朝陽(yáng)區(qū)“北京數(shù)字經(jīng)濟(jì)算力中心”等項(xiàng)目建設(shè),快速形成規(guī);冗M(jìn)算力供給能力,支撐千億級(jí)參數(shù)量的大型語(yǔ)言模型、多模態(tài)大模型、大規(guī)模精細(xì)神經(jīng)網(wǎng)絡(luò)模擬仿真模型、腦啟發(fā)神經(jīng)網(wǎng)絡(luò)等研發(fā)。
(三)建設(shè)統(tǒng)一的多云算力調(diào)度平臺(tái)。利用政府統(tǒng)一入口,降低公有云采購(gòu)成本,普惠中小企業(yè),同時(shí)減少企業(yè)分別面對(duì)不同云廠商的溝通成本。針對(duì)彈性算力需求,建設(shè)統(tǒng)一的多云算力調(diào)度平臺(tái),實(shí)現(xiàn)異構(gòu)算力環(huán)境統(tǒng)一管理、統(tǒng)一運(yùn)營(yíng),方便企業(yè)在不同云環(huán)境上無(wú)縫、經(jīng)濟(jì)、高效地運(yùn)行各類(lèi)人工智能計(jì)算任務(wù)。建設(shè)北京與河北、天津、山西、內(nèi)蒙古等。ㄊ校┧懔旱闹边B基礎(chǔ)光傳輸網(wǎng)絡(luò),進(jìn)一步提升平臺(tái)對(duì)四地算力資源感知能力,探索開(kāi)展算力交易。
(四)歸集高質(zhì)量基礎(chǔ)訓(xùn)練數(shù)據(jù)集。針對(duì)目前大模型訓(xùn)練高質(zhì)量中文語(yǔ)料占比過(guò)少,不利于中文語(yǔ)境表達(dá)及產(chǎn)業(yè)應(yīng)用的問(wèn)題,整合現(xiàn)有開(kāi)源中文預(yù)訓(xùn)練數(shù)據(jù)集和高質(zhì)量互聯(lián)網(wǎng)中文數(shù)據(jù)并進(jìn)行合規(guī)清洗。同時(shí)持續(xù)擴(kuò)展高質(zhì)量多模態(tài)數(shù)據(jù)來(lái)源,建設(shè)合規(guī)安全的中文、圖文對(duì)、音頻、視頻等大模型預(yù)訓(xùn)練語(yǔ)料庫(kù),通過(guò)北京國(guó)際大數(shù)據(jù)交易所社會(huì)數(shù)據(jù)專(zhuān)區(qū)進(jìn)行定向有條件開(kāi)放。
(五)打造“國(guó)家數(shù)據(jù)基礎(chǔ)制度先行先試示范區(qū)”,謀劃國(guó)家級(jí)數(shù)據(jù)訓(xùn)練基地。加快推動(dòng)數(shù)據(jù)要素高水平開(kāi)放的“國(guó)家數(shù)據(jù)基礎(chǔ)制度先行先試示范區(qū)”建設(shè),爭(zhēng)創(chuàng)國(guó)家級(jí)數(shù)據(jù)訓(xùn)練基地,提升北京人工智能數(shù)據(jù)標(biāo)注庫(kù)規(guī)模和質(zhì)量。倡議高質(zhì)量數(shù)據(jù)網(wǎng)站所屬企業(yè)提供部分脫敏高質(zhì)量數(shù)據(jù),進(jìn)行定向有條件開(kāi)放,企業(yè)或科研機(jī)構(gòu)通過(guò)在線申請(qǐng)進(jìn)行有償使用,并探索基于數(shù)據(jù)貢獻(xiàn)、模型應(yīng)用的商業(yè)化場(chǎng)景合作。
(六)搭建數(shù)據(jù)集精細(xì)化標(biāo)注眾包服務(wù)平臺(tái)。建設(shè)指令數(shù)據(jù)集及多模態(tài)數(shù)據(jù)集眾包服務(wù)平臺(tái),開(kāi)發(fā)集成相關(guān)工具應(yīng)用的智能云服務(wù)系統(tǒng),鼓勵(lì)并組織來(lái)自不同學(xué)科的專(zhuān)業(yè)人員標(biāo)注通用人工智能模型訓(xùn)練數(shù)據(jù)及指令數(shù)據(jù),提高訓(xùn)練數(shù)據(jù)的多樣性,給予貢獻(xiàn)者適當(dāng)獎(jiǎng)勵(lì),推動(dòng)平臺(tái)持續(xù)良性發(fā)展。
(七)開(kāi)展大模型創(chuàng)新算法及關(guān)鍵技術(shù)研究。圍繞大型語(yǔ)言模型構(gòu)建、訓(xùn)練、調(diào)優(yōu)對(duì)齊、推理部署等全流程,支持開(kāi)展創(chuàng)新算法及核心技術(shù)研究,形成完整高效的訓(xùn)練體系并對(duì)外開(kāi)源。探索多模態(tài)通用模型架構(gòu),研究大模型高效并行訓(xùn)練技術(shù),以及邏輯和知識(shí)推理、指令學(xué)習(xí)、人類(lèi)意圖對(duì)齊等調(diào)優(yōu)方法,研發(fā)支持百億參數(shù)模型推理的高效壓縮技術(shù)。
(八)加強(qiáng)大模型訓(xùn)練數(shù)據(jù)采集及治理工具研發(fā)。從“采、存、管、研、用”五個(gè)方面,研發(fā)包含數(shù)據(jù)采集、清洗、標(biāo)注、脫敏、存儲(chǔ)等功能在內(nèi)的數(shù)據(jù)處理工具。重點(diǎn)研究互聯(lián)網(wǎng)數(shù)據(jù)全量實(shí)時(shí)更新技術(shù),多源異構(gòu)數(shù)據(jù)整合與分類(lèi)方法,數(shù)據(jù)管理平臺(tái)相關(guān)系統(tǒng),數(shù)據(jù)清洗、標(biāo)注、分類(lèi)、注釋等軟件工具及算法,數(shù)據(jù)內(nèi)容安全審查算法及工具等。
(九)開(kāi)放大模型評(píng)測(cè)基準(zhǔn)及工具。構(gòu)建多模態(tài)多維度的基礎(chǔ)模型評(píng)測(cè)基準(zhǔn)及評(píng)測(cè)方法。建立基礎(chǔ)模型評(píng)測(cè)工具集,提供適應(yīng)性的工具進(jìn)行評(píng)測(cè)。建立公平高效的自適應(yīng)評(píng)測(cè)機(jī)制,根據(jù)評(píng)測(cè)目標(biāo)的不同,自動(dòng)適配不同的工具和指標(biāo)。研究人工智能輔助的智能模型評(píng)測(cè)算法,面向主觀型或生成式的任務(wù),構(gòu)建自動(dòng)化評(píng)估工具。集成包括通用性、高效性、智能性、魯棒性在內(nèi)的多維度評(píng)測(cè)工具,構(gòu)建基礎(chǔ)模型線上評(píng)測(cè)服務(wù)平臺(tái)。
(十)推動(dòng)大模型基礎(chǔ)軟硬件體系研發(fā)。支持研發(fā)分布式高效訓(xùn)練系統(tǒng),實(shí)現(xiàn)模型訓(xùn)練任務(wù)高效自動(dòng)并行。研發(fā)適用于模型訓(xùn)練場(chǎng)景的新一代人工智能編譯器,實(shí)現(xiàn)算子自動(dòng)生成和自動(dòng)優(yōu)化,推動(dòng)人工智能芯片與框架的廣泛適配。研發(fā)人工智能芯片評(píng)測(cè)系統(tǒng),實(shí)現(xiàn)多芯片多框架的自動(dòng)化評(píng)測(cè)。為大模型訓(xùn)練和應(yīng)用提供自主創(chuàng)新的基礎(chǔ)軟硬件生態(tài)底座。
(十一)探索具身智能、通用智能體和類(lèi)腦智能等通用人工智能新路徑。發(fā)展面向通用人工智能的基礎(chǔ)理論框架體系,加強(qiáng)人工智能數(shù)學(xué)機(jī)理、自主協(xié)同與決策等基礎(chǔ)理論研究。推動(dòng)具身智能系統(tǒng)研究及應(yīng)用,突破機(jī)器人在開(kāi)放環(huán)境、泛化場(chǎng)景、連續(xù)任務(wù)等復(fù)雜條件下的感知、認(rèn)知、決策技術(shù)。探索價(jià)值與因果驅(qū)動(dòng)的通用人工智能新路徑研究,打造通用人工智能統(tǒng)一理論框架體系、評(píng)級(jí)標(biāo)準(zhǔn)及測(cè)試平臺(tái),研發(fā)通用人工智能操作系統(tǒng)和編程語(yǔ)言,推動(dòng)通用智能體底層技術(shù)架構(gòu)應(yīng)用。探索類(lèi)腦智能等交叉學(xué)科研究,通過(guò)大腦神經(jīng)元連接模式、編碼機(jī)制、信息處理原理研究,啟發(fā)新型人工神經(jīng)網(wǎng)絡(luò)模型建模和訓(xùn)練方法。
(十二)推動(dòng)在政務(wù)服務(wù)領(lǐng)域率先試點(diǎn)應(yīng)用。圍繞政務(wù)咨詢(xún)、政策服務(wù)、接訴即辦、政務(wù)辦事等工作,率先實(shí)現(xiàn)大模型技術(shù)賦能。借助大模型語(yǔ)義理解、自主學(xué)習(xí)和智能推理等能力,提高政務(wù)咨詢(xún)系統(tǒng)智能問(wèn)答水平,增強(qiáng)多語(yǔ)種交互能力。支撐“京策”平臺(tái)建設(shè),優(yōu)化政策規(guī)范管理和精準(zhǔn)服務(wù)。輔助市民服務(wù)熱線更高效回應(yīng)市民訴求,深化民生大數(shù)據(jù)高效利用。提升辦事服務(wù)便利度,輔助引導(dǎo)辦事人員表單填寫(xiě),輔助綜合窗口人員更精準(zhǔn)提供辦事指引,輔助審批人員提高審批效率,推進(jìn)業(yè)務(wù)數(shù)據(jù)更充分共享、業(yè)務(wù)流程更高效協(xié)同。
(十三)探索在醫(yī)療領(lǐng)域示范應(yīng)用。支持我市有條件的研究型醫(yī)療機(jī)構(gòu)提煉智能導(dǎo)診、輔助診斷、智能治療等場(chǎng)景需求,充分挖掘醫(yī)學(xué)文獻(xiàn)、醫(yī)學(xué)知識(shí)圖譜、醫(yī)學(xué)影像等多模態(tài)醫(yī)療數(shù)據(jù),構(gòu)建基于醫(yī)療領(lǐng)域通用數(shù)據(jù)與專(zhuān)業(yè)數(shù)據(jù)的智能應(yīng)用,實(shí)現(xiàn)對(duì)各種疾病和癥狀的準(zhǔn)確識(shí)別和預(yù)測(cè),輔助醫(yī)療機(jī)構(gòu)提高疾病診斷、治療和預(yù)防的決策水平。
(十四)探索在科學(xué)研究領(lǐng)域示范應(yīng)用。發(fā)展科學(xué)智能,加速人工智能技術(shù)賦能新材料和創(chuàng)新藥物領(lǐng)域科學(xué)研究。支持我市能源、材料、生物領(lǐng)域相關(guān)實(shí)驗(yàn)室設(shè)立科研合作專(zhuān)項(xiàng),與我市相關(guān)科研機(jī)構(gòu)和創(chuàng)新企業(yè)開(kāi)展聯(lián)合研發(fā),充分挖掘材料、蛋白質(zhì)和分子藥物領(lǐng)域?qū)嶒?yàn)數(shù)據(jù),研發(fā)科學(xué)計(jì)算模型,開(kāi)展新型合金材料、蛋白質(zhì)序列和創(chuàng)新藥物化學(xué)結(jié)構(gòu)序列預(yù)測(cè),縮短科研實(shí)驗(yàn)周期。
(十五)推動(dòng)在金融領(lǐng)域示范應(yīng)用。進(jìn)一步挖掘我市金融行業(yè)應(yīng)用場(chǎng)景,系統(tǒng)布局一批金融機(jī)構(gòu)場(chǎng)景開(kāi)放“揭榜掛帥”項(xiàng)目。支持金融科技企業(yè)針對(duì)金融場(chǎng)景中信息負(fù)載高,信息更新快,金融從業(yè)者難以快速全面的獲取準(zhǔn)確信息的問(wèn)題,探索面向金融文本深度理解和分析的人工智能技術(shù)應(yīng)用。聚焦智能風(fēng)控、智能投顧、智能客服等環(huán)節(jié),推動(dòng)實(shí)現(xiàn)金融專(zhuān)業(yè)長(zhǎng)文本的精準(zhǔn)解析和模型知識(shí)的更新,突破復(fù)雜決策邏輯與模型信息處理能力間的融合技術(shù),實(shí)現(xiàn)從復(fù)雜金融信息處理到投資決策建議的轉(zhuǎn)化,支撐金融領(lǐng)域的投資輔助決策。
(十六)探索在自動(dòng)駕駛領(lǐng)域示范應(yīng)用。支持自動(dòng)駕駛企業(yè)研發(fā)多模態(tài)自動(dòng)駕駛技術(shù),發(fā)揮大型語(yǔ)言模型高維語(yǔ)義理解和泛化優(yōu)勢(shì),基于車(chē)路協(xié)同數(shù)據(jù)和車(chē)輛行駛多傳感器融合數(shù)據(jù),提高自動(dòng)駕駛模型多維感知和預(yù)測(cè)性能,有效解決復(fù)雜場(chǎng)景長(zhǎng)尾問(wèn)題,輔助提高車(chē)載自動(dòng)駕駛模型泛化能力。支持在北京市高級(jí)別自動(dòng)駕駛示范區(qū)3.0建設(shè)中,構(gòu)建車(chē)路協(xié)同數(shù)據(jù)庫(kù),引導(dǎo)企業(yè)開(kāi)展基于真實(shí)場(chǎng)景的自動(dòng)駕駛模型訓(xùn)練迭代。探索基于低時(shí)延通訊的云控自動(dòng)駕駛模型測(cè)試,發(fā)展自動(dòng)駕駛新技術(shù)路徑。
(十七)推動(dòng)在城市治理領(lǐng)域示范應(yīng)用。支持人工智能研發(fā)企業(yè)結(jié)合智慧城市建設(shè)場(chǎng)景需求,率先在城市大腦建設(shè)中引進(jìn)大模型技術(shù),開(kāi)展多感知系統(tǒng)融合處理技術(shù)研發(fā),打破城市治理中各系統(tǒng)數(shù)據(jù)孤島,實(shí)現(xiàn)智慧城市底層業(yè)務(wù)的統(tǒng)一感知、關(guān)聯(lián)分析和態(tài)勢(shì)預(yù)測(cè),科學(xué)調(diào)配政府資源和行政力量,為城市治理提供更加綜合全面的輔助決策能力。
(十八)持續(xù)推動(dòng)監(jiān)管政策和監(jiān)管流程創(chuàng)新。探索營(yíng)造穩(wěn)定包容的監(jiān)管環(huán)境,積極推動(dòng)人工智能領(lǐng)域新技術(shù)賦能傳統(tǒng)行業(yè)的包容審慎監(jiān)管,支持人工智能算法、框架等基礎(chǔ)技術(shù)的自主創(chuàng)新、推廣應(yīng)用、國(guó)際合作。鼓勵(lì)優(yōu)先采用安全可信的軟件、工具、計(jì)算和數(shù)據(jù)資源,通過(guò)改進(jìn)算法等技術(shù)手段,確保訓(xùn)練數(shù)據(jù)集的規(guī)范性。鼓勵(lì)生成式人工智能產(chǎn)品在科研等非面向公眾服務(wù)領(lǐng)域?qū)崿F(xiàn)向上向善應(yīng)用。積極向國(guó)家網(wǎng)信部門(mén)爭(zhēng)取,在中關(guān)村核心區(qū)建立先行先試,推動(dòng)實(shí)行包容審慎監(jiān)管試點(diǎn)。
(十九)建立常態(tài)化服務(wù)和指導(dǎo)機(jī)制。做好對(duì)擬面向公眾提供服務(wù)的生成式人工智能產(chǎn)品的安全評(píng)估工作,建立常態(tài)化聯(lián)系服務(wù)和指導(dǎo)機(jī)制,督促企業(yè)遵守法律法規(guī)要求,尊重社會(huì)公德、公序良俗。優(yōu)化安全評(píng)估流程機(jī)制,細(xì)化對(duì)大模型算法設(shè)計(jì)、訓(xùn)練數(shù)據(jù)源篩選、內(nèi)容安全性、人工標(biāo)注規(guī)則的審核評(píng)估標(biāo)準(zhǔn),開(kāi)展精準(zhǔn)化服務(wù)指導(dǎo),加快推進(jìn)我市人工智能企業(yè)相關(guān)技術(shù)產(chǎn)品的安全評(píng)估工作。指導(dǎo)企業(yè)建立健全算法安全防范機(jī)制,在產(chǎn)品研發(fā)階段引入技術(shù)工具進(jìn)行安全檢測(cè),督促企業(yè)積極履行算法備案和變更、注銷(xiāo)備案手續(xù)。發(fā)布《北京市互聯(lián)網(wǎng)信息服務(wù)算法推薦合規(guī)指引》,引導(dǎo)創(chuàng)新主體樹(shù)立安全責(zé)任意識(shí),健全管理制度、強(qiáng)化技術(shù)手段、促進(jìn)企業(yè)算法合規(guī)發(fā)展。
(二十)加強(qiáng)網(wǎng)絡(luò)服務(wù)安全防護(hù)和個(gè)人數(shù)據(jù)保護(hù)。指導(dǎo)算力運(yùn)營(yíng)主體落實(shí)《網(wǎng)絡(luò)安全法》《數(shù)據(jù)安全法》《個(gè)人信息保護(hù)法》等法律規(guī)定,加強(qiáng)網(wǎng)絡(luò)和數(shù)據(jù)安全管理,明確網(wǎng)絡(luò)安全、數(shù)據(jù)安全和個(gè)人信息保護(hù)主體責(zé)任,強(qiáng)化安全管理制度建設(shè)和工作落實(shí),鼓勵(lì)企業(yè)開(kāi)展數(shù)據(jù)安全管理認(rèn)證及個(gè)人信息保護(hù)認(rèn)證,落實(shí)數(shù)據(jù)跨境傳輸安全管理制度,全面提升網(wǎng)絡(luò)安全和數(shù)據(jù)安全防護(hù)能力。
(二十一)持續(xù)提升人工智能產(chǎn)業(yè)倫理治理自律自治能力。落實(shí)國(guó)家新一代人工智能創(chuàng)新發(fā)展試驗(yàn)區(qū)建設(shè)任務(wù),加強(qiáng)人工智能倫理安全規(guī)范及社會(huì)治理實(shí)踐研究,研發(fā)并部署人工智能倫理治理公共服務(wù)平臺(tái),服務(wù)政府監(jiān)管與產(chǎn)業(yè)自律自治,強(qiáng)化相關(guān)責(zé)任主體科技倫理規(guī)范意識(shí),提升科技倫理治理能力。(校對(duì)/韓秀榮)