Cover photo

区块链与AI推理的现状

引言区块链技术和人工智能(AI)目前是科技界最热门的领域之一,而且有充分的理由。AI正在快速自动化任务,并做出曾经被认为只有人类才能做出的决策,而区块链技术作为一种新型去中心化计算范式,可能彻底改变现代金融系统。

在本文中,我们将深入探讨这两个领域的当前整合状态。我们将讨论AI在区块链上的应用场景,为什么AI在Web2.0中比Web3.0中更为普遍,以及目前已有的解决方案和整合过程中面临的主要挑战。

尽管AI已经存在数十年,但随着大型语言模型的商业化,最近AI的普及再次引起广泛关注,展示了AI对我们生活的巨大影响。然而,AI的应用场景远不止于ChatGPT;在医疗保健领域,AI被用于诊断和治疗。在消费应用中,AI被用于算法推荐,决定用户在主页上看到的内容。AI的应用无穷无尽,研究表明,未来十年AI市场规模的年复合增长率(CAGR)将达到约20%。

post image

区块链技术在过去五年里也迅速走红,链上锁定的资本现已达到数百亿美元。区块链技术为金融系统带来了更高的效率、更大的透明度和抵抗审查的能力,并引发了去中心化应用(dApp)的爆发式增长:从去中心化交易所或借贷市场等金融应用,到NFT(非同质化代币)收藏或游戏中虚拟资产的代币化等新的使用场景。

然而,AI在Web2.0和Web3.0中的发展状态对比却相当明显。在Web2.0中,AI技术似乎已经渗透到我们生活的每个角落:从Siri、Instagram的推荐内容,到Amazon网上购物时的首页推荐。不幸的是,大多数现代区块链的应用场景中,AI的应用并不广泛。例如,自动做市商(AMM)仍然使用静态和任意决定的价差,系统化交易算法或简单的模型驱动分析以及大多数计算密集型工作负载都无法在链上执行。而这些应用场景也非常重要,因为去中心化金融(DeFi)应用锁定了数十亿美元的价值。那么,这是为什么呢?尽管AI与区块链的融合有许多潜在的影响,AI可以像在Web2.0中那样进一步增强Web3.0中的现有应用场景,但两者的整合依然面临着挑战。

AI与区块链融合的难点

AI与区块链整合的难点之一在于两者在去中心化设计理念上的明显冲突。一方面,AI的训练和推理成本极高,无论是在资金方面还是在计算需求方面:例如,仅训练GPT-3的成本大约为1200万美元。此外,公司还开发了极为专业的硬件来训练模型并进行推理服务:例如,在GPU上运行AI推理时效率可以提高60-70%。高昂的计算和成本门槛导致了AI训练和推理过程中的高度集中化:这些模型通常是在功能强大的高性能计算集群或服务器上训练和服务的,大量的用户推理请求需要在这些设备上进行计算。

post image

另一方面,区块链技术的核心支柱之一就是去中心化,这在经典的区块链三难困境中经常被提及。如果你不熟悉这一概念,现代区块链通常必须在设计架构时在安全性、去中心化和可扩展性之间找到平衡。在这种情况下,提高运行完整节点的计算需求可能会对性能(从而对区块链的可扩展性)产生积极影响,但这将对去中心化程度产生负面影响,因为运行完整节点的要求变得更高。这是将计算密集型过程(如AI模型的训练或推理)整合到区块链中的主要障碍之一,因为区块链希望保持尽可能高的去中心化。

在接下来的部分中,我们将探讨在AI推理背景下,AI在区块链上本地实现的局限性和挑战,以及链下实现的相关问题。

post image

原生推理的挑战链上AI原生实现主要面临三个不同的挑战。首先,如前文所述,验证节点的硬件要求带来了计算能力的限制。其次,由于现代权益证明(PoS)网络中每个区块的Gas限制,扩展遇到瓶颈。最后但同样重要的是,当每个完整节点都需要执行每一次推理以验证状态时,扩展性变得更加困难。

在继续之前,为了澄清“原生”实现的含义,我们将其定义为在区块链网络中由验证节点直接在链上执行推理或训练模型。

如前一部分所述,硬件限制使得CPU验证节点不适合服务AI推理。GPU拥有比CPU更多的核心,这使得它们可以同时执行更多的计算。例如,典型的GPU可能拥有1000个核心,而典型的CPU可能只有4个核心。GPU也更适合浮点运算,而浮点运算是AI任务中最常见的运算类型。如果不运行由高性能GPU验证节点组成的网络(这会以去中心化为代价),实现可扩展的链上推理将变得非常困难。

post image

在CPU验证节点上进行推理或训练本身效率已经很低,更何况还要考虑每个区块的Gas数量非常有限。对于不熟悉的人来说,“Gas”基本上是区块链上计算量的度量,计算量越大的过程需要消耗更多的Gas。区块链对每个区块的Gas有上限,这意味着一个区块中的所有交易计算量有一个最大限制。这一点很重要,因为它对区块的大小设定了限制,并确保完整节点能够跟上网络的验证速度。换句话说,如果一个区块中的计算量过大,验证节点可能因为空间和速度要求无法跟上网络。考虑到网络拥堵已经是区块链的一个重大问题,加入耗费大量计算资源的AI过程可能会加剧这个问题。

最后,区块链网络的安全性也是一个重要方面,因此现代的权益证明(PoS)区块链完整节点会重新执行提议区块中的交易,并通过验证区块后状态来达成共识。这意味着如果存在链上AI,那么用户运行的每次推理,所有完整节点都需要运行一次。想象一下,全球数千用户在区块链上运行数千次推理,而您的家庭CPU验证节点需要执行所有这些推理。在常规交易的背景下,这可能不算什么,但对于已经计算密集的AI模型推理来说,这些推理在效率较低的硬件上运行,这进一步成为链上原生AI的障碍。

链下推理的挑战

上述链上原生实现的挑战促使项目考虑链下的实现方法。有几种方法可以实现,但通常类似于这样的工作流程:某个请求在链上发出,随后一个监听节点向链下的模型提供者发出API请求,模型提供者计算该请求,然后负责方将请求结果写入链上智能合约内存,以便可以检索。

虽然这种方法比上述链上实现更具可扩展性和效率,但它引入了一个全新的问题:完整性。

AI模型通常被称为“黑箱”,原因很充分。这是因为人们通常对模型生成推理结果的原因和方式缺乏透明度和深入了解。因此,可以想象,链下推理会使区块链网络暴露于全新的攻击矢量。举一个实际的例子来说明这一点:想象一个依赖链下机器学习来预测代币回报率的协议,在进入多头/空头仓位之前反映这些预测。如果我是提供这些推理的模型提供者,我可以故意不运行模型,而是返回一些虚假的结果,然后简单地抢跑或夹击他们的交易以轻松获利。我可以错误地返回一个信号,让他们买入$DOGE,然后我在他们之前买入$DOGE,并在他们买入后立即卖出,从他们的市场影响中获利。这是非常糟糕且极其危险的,因为与许多安全漏洞不同,它可以完全不被发现。

为了让区块链真正发展依赖AI的应用场景,必须建立确保推理完整性的安全协议。

post image

解决方案AI与区块链整合的解决方案主要分为两部分,涉及零知识机器学习(ZKML)和乐观机器学习(OPML)。在未来的博客文章中,我们将详细介绍这些解决方案,而这些解决方案都将被Vanna区块链原生集成到链上。

零知识机器学习

ZKML是一个前沿的研究领域,它通过生成密码学证明,旨在证明某些计算(在本例中为某个模型执行的推理)是正确且具有完整性的。正如EZKL简要描述的那样,我们可以创建ZK证明来加密证明以下陈述:

“我在某些私有数据上运行了这个公开的神经网络,并生成了这个输出”

或者

“我在某些公开数据上运行了我的私有神经网络,并生成了这个输出”

“零知识”这一术语来源于这样的事实,即像模型输入或模型权重等某些内容可以对验证者保密,而不会影响证明的密码学安全性。

ZK的出现对于去中心化的AI/ML具有巨大意义,因为推理的执行以及证明的生成现在可以在一台高性能计算机上完成,而证明可以通过轻节点网络进行低成本验证,以确保推理正确,而不需要在整个网络上重复计算!

然而,虽然ZK证明的验证可以在常数时间内以低成本完成,但ZKML当前面临的最大挑战是生成ZK证明所需的极高计算成本和时间成本。为此,公司如Cysic正在开发专门用于证明生成的硬件,而EZKL的开发者们也在不断改进他们的软件,以加快证明生成的速度。

乐观机器学习

乐观机器学习是另一种去中心化AI推理的解决方案,“乐观”指的是在没有挑战的情况下,默认信任推理结果,除非(或直到)有人对结果提出质疑。

在挑战过程中,挑战者首先需要提供一笔资金作为押金,然后进行验证游戏,使用二分协议定位导致计算偏差的争议步骤。仲裁智能合约解决挑战问题,并根据挑战的成功或失败,分别对推理计算者或挑战者进行严厉的罚金处罚。

这种“无罪推定”的乐观模型相较于ZKML既有优点也有缺点。最大的优势是采用不为每次推理生成证明的模型会显著降低时间和计算成本,尤其是在推理和生成证明都极其昂贵的大模型中,成本降低效果更加显著。然而,最大的劣势是缺乏ZKML提供的即时加密安全性,并且在挑战成功的情况下,可能会导致区块链的停滞或重放交易等问题。

结论

虽然AI和区块链的交汇点是一个极具吸引力的领域,因为AI可以像它在Web2.0中所做的那样,彻底改变Web3.0的应用场景,但软件架构和硬件要求的固有限制确实使这一挑战变得困难。

这正是Vanna Labs正面应对的难题,通过OPML和ZKML等前沿解决方案,Vanna网络将能够以可扩展且安全的方式执行链上推理。请关注我们的Medium页面、官网和Twitter,更多更新内容即将发布。

Twitter: https://twitter.com/0xVannaLabs

Website: https://www.vannalabs.ai/

https://medium.com/tag/blockchain?source=post_page-----c0e386356d49--------------------------------

https://medium.com/tag/ai?source=post_page-----c0e386356d49--------------------------------

https://medium.com/tag/defi?source=post_page-----c0e386356d49--------------------------------

https://medium.com/tag/tech?source=post_page-----c0e386356d49--------------------------------