9月5日,在2024 Inclusion·外灘大會“從DATA for AI到AI for DATA”見解論壇上,由螞蟻集團發(fā)起的,旨在提高數(shù)據(jù)庫與大模型應用開發(fā)效率的“星辰智能社區(qū)”新發(fā)布了兩個項目:AI原生數(shù)據(jù)應用開發(fā)框架DB-GPT新版本與向量索引庫VSAG。
DB-GPT是一個開源的AI原生數(shù)據(jù)應用開發(fā)框架。在數(shù)據(jù)庫領域,如何增強和大語言模型的交互任務,減少大模型的幻覺,為用戶提供可靠并且安全的數(shù)據(jù)理解和分析能力,仍然是一項極具挑戰(zhàn)的工作。DB-GPT通過開發(fā)多模型管理(SMMF)、Text2SQL效果優(yōu)化、RAG框架以及優(yōu)化、Multi-Agents框架協(xié)作、AWEL(智能體工作流編排)等多種技術能力,讓圍繞數(shù)據(jù)庫構建大模型應用更簡單便捷。
本次開源的新版本 DB-GPT v0.6.0,完整支持了數(shù)據(jù)驅動的AI原生應用生命周期管理(AI Native Data Apps-dbgpts)以及AI原生應用倉庫,方便開發(fā)者構建、發(fā)布、分享AI Native Data Apps,還新增了六大特性,包括將AWEL協(xié)議升級至2.0,支持更復雜的編排;結合TuGraph,能支持圖的構建與檢索,進一步增強檢索的準確性與召回的穩(wěn)定性,以減少大模型的幻覺,在同樣的檢索效果下,構建Graph的成本比業(yè)界的方案少50%的Tokens;支持Agent Memory,如感知記憶、短期/長期記憶、混合記憶等;支持意圖識別、槽位填充,支持Text2NLU、Text2GQL微調等。
社區(qū)還新發(fā)布向量索引庫VSAG。VSAG是螞蟻集團在向量數(shù)據(jù)庫上一系列的工程優(yōu)化與向量索引的算法改進成果,適用于高維向量的存儲和計算優(yōu)化,并能提供 C++ 和 Python 的接口以便使用。VSAG已在螞蟻內部百億數(shù)據(jù)量級業(yè)務上使用,在保證同樣的召回率情況下,VSAG 可以通過量化和基于磁盤的重排技術,將內存消耗降低到 HNSW(最流行的向量索引)的 1/10,從而實現(xiàn)生產部署成本的大幅降低。VSAG將結合DB-GPT,讓RAG的構建更加簡單、高效,同時VSAG作為獨立開放的向量引擎,也將支持LangChain、LlamaIndex構建RAG應用。
“星辰智能社區(qū)”由螞蟻集團發(fā)起,專注于AI時代數(shù)據(jù)智能技術的探索,社區(qū)在GitHub上已獲得17k Star數(shù),核心成員來自螞蟻、阿里、美團、京東、唯品會等科技公司和知名海內外高校碩博在校學生。目前已有超過50萬用戶正在學習和使用DB-GPT,社區(qū)活躍人數(shù)近7000人,開發(fā)貢獻者130人。