导读 本文根据 Fabarta 资深技术专家谭宇在“2023 中国软件技术大会”演讲实录整理而来。围绕以下四个方面进行介绍:首先简单介绍Fabarta 背景以及我们为什么要研发 ArcNeural;其次深入介绍 ArcNeural 的架构与实现;三是介绍围绕 ArcNeural 我们如何构建 AI 应用;最后进行总结与展望。
01 AI 时代的数据基础设施
Fabarta 与 ArcNerual 概览
先简单介绍一下 Fabarta 的背景。Fabarta 成立于 2021 年,还比较年轻,我们说自己是一家 AI 基础设施公司。在 Fabarta 创立之初,ChatGPT 尚未发布,AI 技术的发展似乎也陷入了停滞。当时中国的创业公司以数据库、数据仓库、数据中台等基础设施领域为热点。我们的创始人和创始团队对这些领域也非常了解,但最终我们选择了 AI 基础设施这个赛道,这是基于创始团队对客户需求和技术发展的深刻洞察。
如同 Fabarta 的愿景所描述的:“数联世界,智见未来”,在过去,整个社会已经积累了大量数据,尽管数据的存储和计算依然存在大量需求,但更重要的是,如何以更高效、便捷的方式从这些数据中获取业务价值。这正是 AI 要解决、能够解决的问题。尽管当时 AI 的发展似乎放缓,甚至面临再次陷入沉寂的风险,但我们根据过往的数字化经验判断,这一次情况与以往不同。
在过去的一段时间里,我们服务了大量的客户,特别是一些行业的头部客户,最终形成了“一体两翼”的产品矩阵。“一体” 即今天要分享的 ArcNeural,实现对数据、算力以及模型运行时的管理,从基础层面实现 AI 就绪( Infrastructure Ready for AI)。“两翼”分别指数据和 AI,其中数据翼提供了完善的多模态数据管理功能,有效帮助企业治理并盘点数据资产。“AI 翼”打通了模型工厂能力和企业私有知识融合能力,并采用低代码化方式,帮助企业快速使用大模型,结合企业私有知识进行 AI 应用落地(AI Ready for Apps)。
目前,我主要专注于 ArcNeural 的开发和建设。在加入 Fabarta 之前,我在阿里云工作十余年,主要经历是从事数据库和数字化转型服务相关的工作,对这两个领域有比较丰富的经验和理解。接下来,让我们深入探讨 Fabarta 为什么选择构建这样的产品矩阵。
基础设施演进滞后性

基础设施领域的演进过程往往呈现出一定的滞后性。 通常情况下,变革首先从业务层面和上层技术开始发生一些变化,逐渐传导到基础设施领域。随后,基础设施的发展又会反过来影响上层的业务与技术。比如说,云计算就是在互联网兴起的背景下出现的,随着时间推移,云计算发展到一定阶段,所使用的技术被总结为“云原生”。而云原生技术再次影响到上层的业务设计和技术实现。本质上,技术就是通过这种循环不断实现着迭代和发展。
在过去不到 20 年的时间里,我们经历了三次大的技术浪潮,这个速度是前所未有的。这种快速变化背后有许多原因,特别是许多意外因素加速了这种变革。比如说,疫情加速了数字化,而 ChatGPT 的出现让大家看到了通用人工智能的希望。通常情况下,一次技术浪潮的变革需要经历完整的技术成熟度曲线,可能需要大约 20 年的时间。但在过去的 20 年里,我们经历了三次技术浪潮,罕见地出现了三次技术浪潮共舞的情况。
如今许多企业仍在谈论云化、云原生,有些企业正在进行业务数字化,还有一些在探索智能化。更有一些企业不仅在推动基础设施的云化,同时在进行业务数字化,并且还在探索智能化。这也是我们在讨论 AI 时代基础设施时所必须要考虑的事情。一方面,必须充分关注企业在云和数字化方面的状况,如果 AI 没有办法落地,那讨论 AI 的基础设施也就失去了实际意义;另一方面,必须要考虑 AI 的切入点,特别是在大语言模型问世以后,企业如何快速实现部分业务的智能化;最后,还需要思考 AI 应用落地后对现有业务的改变与促进,最终完成我们刚刚提到的技术演进循环。
构建 AI 时代的数据基础设施
所以,从以上几个点出发,我