# 将 TB 级数据引入智能合约:与来自Space and Time的 Scott Dykstra 聊天 **Published by:** [honey](https://paragraph.com/@duoergun/) **Published on:** 2024-01-31 **URL:** https://paragraph.com/@duoergun/tb-space-and-time-scott-dykstra ## Content 区块链的前提是其处理的数据不可篡改。但到目前为止,与企业必须使用的吞吐量相比,主要区块链的吞吐量非常小。 更重要的是,区块链甚至无法有效地访问自己的数据。以太坊存档节点需要 3 到 12 TB 的数据(取决于实施情况),但智能合约根本无法在不花费大量天然气的情况下访问这些数据。 许多项目构建了索引器来解决与区块链数据归档相关的低效率问题,解决一些直接需求,例如 DEX 分析页面。但空间和时间这个领域的新成员正在努力将这一概念提升到一个全新的水平。 时空依托加密的 SQL 证明系统构建了一个全面的“数据仓库”系统,旨在将数据验证能力扩展到数百 TB。随着人工智能的发展,即使在 Web3 之外,这一点也变得越来越重要。 我们与 Space and Time 首席技术官 Scott Dykstra 进行了座谈,详细了解该公司如何充分利用区块链的潜力。 嗨,斯科特,很高兴认识你。让我们首先对该主题进行基本介绍。为什么世界需要可验证且防篡改的数据?这只是 Web3 的一个用例,还是您认为它会扩展到其他领域? SD: 我认为,随着我们进入一个混乱的、人工智能驱动的世界,验证数据没有被篡改以及数据计算是否正确完成变得更加重要。归根结底,就是相信我们所依赖的系统是中立、透明和未被篡改的。 Web3 中的用例非常清晰,全球节点运营商网络正在汇集其计算资源来为可证明的网络提供支持,但它在 Web3 之外的多个行业中也很重要。 你想知道像银行这样的金融系统没有被操纵。您希望股票或加密货币等交易系统透明且可追踪。您希望企业能够以保护隐私但不可篡改的方式共享敏感数据(例如患者医疗保健数据或会计记录)。 如果您有能力证明数据和数据处理没有被篡改,并且您可以使用熟悉的数据库工具以合理的成本来做到这一点,为什么不呢? 您提到人工智能在我们的生活中变得越来越普遍。许多人担心我们无法看到其内部运作方式,因此围绕它的讨论通常集中在“调整”它并控制其输出。您认为这是一个可以实现的目标吗?如果可以,如何实现? SD: 当我们对大型语言模型的大小进行分类时,我们谈论的是数十亿个参数。我相信 Llama 2(最流行的开源 LLM)中有 700 亿个参数。您可以将这些参数视为数据库中的 700 亿个数据点。如果大型语言模型的训练直接来自保存这些数据点的可验证数据库,那么您可以以不信任、透明的方式训练人工智能模型。 如果输入训练模型的数据是通过可验证电路直接从空间和时间输入的,那么您可以证明输入数据是防篡改的。同样的原则适用于模型的权重和设置。当然,这会变得更加复杂,因为我们必须证明它们在离开时空之后没有被篡改。 说到人工智能,Space and Time 最近发布了一个聊天机器人,可以自动为您的系统生成 SQL 查询。告诉我们更多相关信息,以及您决定发布它的原因。您认为当前的法学硕士对于这种用途来说足够精确吗? SD: 幸运的是,是的。当我们提供必要的上下文时,我们对 GPT-4 返回的 SQL 质量感到震惊。我们构建了一个系统,用户可以在其中提供简单的提示,然后将该提示连同用户正在使用的数据库的所有上下文一起发送到 GPT-4:表、列、外键、SQL 语法示例。我们对其准确性感到震惊 — 我们看到客户报告 SQL 行数低于 30 行的查询的准确性为 80% 到 90%。对于如此复杂的查询,它的准确度令人难以置信。 我们构建这个系统是为了解决我们认为重要、普遍且尚未解决的问题:没有人喜欢编写 SQL 来查询数据库。在我看来,这是 GPT-4 的完美用例,但 GPT-4 还不够先进,无法在没有大量人工干预的情况下编写代码。但它非常擅长写SQL。而人则不然。 Space and Time 在同类产品中是独一无二的,因为它通过加密证明(您称为 SQL 证明)来验证数据。您能给我们一个 ELI5 来说明它是如何工作的吗? ZK 证明如何保证查询及其数据的正确性? SD: 关键是,一旦数据被摄入时空,我们就会获取数据的数字指纹,无论它来自哪里,无论它是我们从主要区块链收集的数据,还是从视频游戏服务器流入的数据或 TradFi 市场,或应用程序插入的数据。 我们捕获数字指纹——如果你愿意的话,几乎就像数据的奇特哈希——然后将其放在链上的智能合约中。所有原始数据都加载到我们的数据仓库中,但指纹足够小,可以以经济实惠的方式存储在链上。然后,当你查询数据时,数据仓库会生成查询结果以及一个称为ZK证明的加密电路,证明不仅查询的底层数据没有被篡改,而且数据的实际处理也没有被篡改。 。 最后,我们以一种非常简单且计算量轻的方式向智能合约发送查询结果、证明和数字指纹。智能合约可以进行一些快速数学运算,将查询结果与证明进行比较。它甚至不必是一个验证它的智能合约,它可以是运行客户端库的 iPhone、银行系统或可信的第三方审计师。 我们构建了这个验证框架,以便任何人都可以做到——它不仅仅适用于 Web3。真正的关键是那些数字指纹。 那么有了空间和时间,智能合约就可以直接查询可验证的数据仓库,对吗?这种功能的用例是什么? SD: 我们相信 Web3 的下一波浪潮是数据驱动的金融服务,其中智能合约能够存储和处理大量数据,并回答有关其自己的链或其他地方的活动的非常复杂的问题。 如今,智能合约甚至无法回答诸如“向我展示所有拥有两个 NFT 的钱包”之类的基本问题。对于下一波 Web3,他们需要能够回答更复杂的问题,例如“特斯拉股票的隐含波动率是多少?”或者“美国目前的无风险利率是多少?”这些是重要的金融原语,需要对历史数据进行计算。 下一波金融服务将要求智能合约能够提出任意问题,而这些问题的答案就是处理大量数据。空间和时间可以处理这个过程。 您如何看待未来该行业从 Space and Time 和 Proof of SQL 中受益?如果您愿意的话,您对产品将如何改变我们的生活的乌托邦愿景是什么? SD: 数据仓库为全球业务提供动力,但集中式云服务成本极高。去中心化的数据仓库意味着社区可以贡献计算——任何人都可以建立数据库服务器,将其借给网络并因其所做的工作而获得报酬,这大大降低了数据库计算的成本。 我们可以提供更实惠的服务,其性能与流行的云数据仓库类似。但这样做需要 SQL 证明。如果我们允许世界上任何人贡献服务器,我们就必须证明这些服务器没有被篡改。这就是乌托邦的一部分:提供更实惠的数据库服务来推动全球商业发展。 另一件事情是为 Web3 行业提供一种处理比链上数据量大得多的数据的方法,即使是在更新、更具可扩展性的链(如 L2)上也是如此。空间和时间是一个位于每个主要链旁边的解决方案,并补充链的计算和存储。 第三,也是最重要的一点是,空间和时间提供了一种将区块链的去信任性质引入数据库的方法。世界上的业务都在数据库上运行,区块链引入了去信任和可证明的理念;我们正在将该技术引入数据库。 现在这一切意味着什么?这意味着所有行业都无需信任——例如,确保银行家无法操纵他们的账簿并假装他们拥有实际上并不存在的储备或资产。 空间和时间赋予了这个世界力量,并且可以以一种极其经济有效的方式做到这一点。这也意味着区块链技术最终可以扩展到世界的商业逻辑。如果智能合约能够可靠地提出有关 TB 级传统业务数据的问题,我们最终就能迎来 Web3 的愿景,即把世界的业务逻辑放在链上。 赞助商链接 使用此应用程序成为更高效的作家 语法 这就是我们在时空建设的未来。 https://www.nasdaq.com/articles/bringing-terabytes-of-data-to-smart-contracts-chatting-with-scott-dykstra-from-space-and ## Publication Information - [honey](https://paragraph.com/@duoergun/): Publication homepage - [All Posts](https://paragraph.com/@duoergun/): More posts from this publication - [RSS Feed](https://api.paragraph.com/blogs/rss/@duoergun): Subscribe to updates - [Twitter](https://twitter.com/AAA12388321): Follow on Twitter