Web3 Developer
Web3 Developer

Subscribe to yewlne

Subscribe to yewlne
Share Dialog
Share Dialog
<100 subscribers
<100 subscribers
1、万字讲透去中心化存储 https://zhuanlan.zhihu.com/p/107707161 摘要 去中心化存储是一种通过分布式存储技术将文件或文件集分片存储在不同供应方提供的磁盘空间上的存储商业模式。它主张强隐私保护、低存储成本、数据冗余备份存储、高速等价值主张、开源的应用程序和算法,只有全部实现以上主张才可能大范围代替中心化存储。它有利于规避单点故障和数据的价值传递。 去中心化存储的架构自下而上依次为TCP/IP协议、区块链、去中心化存储协议和应用层。其中,TCP/IP协议对应Layer 0的网络层,包括网络拓扑结构以及交易的传播机制;区块链属于Layer 1,它自下而上分别为加密基础设施(一般为SHA-256等算法)、存储证明机制(共识机制);去中心化存储协议(服务层)包括存储协议(链上)、检索协议(链下)、身份协议(链上)、内容分发协议、激励协议等,包括Layer 1的激励分配机制和Layer 2的智能合约与脚本文件;最上层则是应用层,包括客户端软件和加速软件等。 去中心化存储与中心化存储在存储空间来源、带宽来源、安全性、使用方式、行业发展状态等多个维度存在差异,导致其规模和性能远远不如中心化存储系统。虽然IPFS等项目通过不同的“非中心化”设计方式弥补了其不同的缺陷,通过对上传方和存储节点给予代币激励的方式使全网存储总规模扩大,但是项目方与用户的利益不一致、费用结构的劣势等方面因素使去中心化存储的发展陷入瓶颈和停滞。本文结合实际情况,对去中心化存储实现其价值主张提供了参考建议。
正文 1 去中心化存储背景与价值主张 1.1. 去中心化存储产生的背景 WEB 3.0提倡“以数据为中心,数据价值化和隐私保护”,而去中心化存储在其中扮演着至关重要的角色,其中数据安全和隐私保护对应数据冗余存储和备份功能,而数据价值化对应的是文件共享的价值传递。数据安全方面,相比较于个人,企业往往更加重视公司数据的安全和隐私保护。企业存储在云端的数据往往是公司的机密,很多数据一旦被泄露很可能将公司在市场竞争上至于不利的地位,传统的公司资料实物存储方法对于大型企业来说早已不足以支撑海量数据存储的需求;数据价值共享方面,越来越多的人希望共享资源的同时获得相应的交换价值。比如人大经济论坛和喜马拉雅等平台在共享知识学习和文件的时候需要通过法币或积分的形式换取,而百度网盘和迅雷大多数则是以免费的形式进行价值传递,它们仅仅只是对下载速度等性能收取会员费,而共享内容的种子方并没有获得因共享文件而获得的价值。 近几年来,全球和国内云存储市场发展迅速,从GB级别到TB级别再上升到PB级别,文件存储的种类越来越多,文件的数据量也越来越大。 2012-2017年,全球云存储市场维持20%以上的高复合增速,而国内云存储市场的增速维持在85%-110%。根据多家机构的预测结果,预计2022年全球云存储市场规模将达到1000亿美元以上。 虽然云存储市场的规模和用户在飞速增长,但是中心化存储市场却具有四大缺陷:无法保障版权、无法保障数据安全、随时面临服务商停止运营的风险、数据缺乏价值化。 不论是由亚马逊等公司的第三方中心化存储,抑或者是公司本身存储用户的数据,从法律角度上用户对他们泄露数据信息不具有期待可能性。尤其是在数据为王的商业模式时代,精准数据将对各行各业的重构,控制数据来源或者以比竞争对手更低的成本获取数据的企业,其竞争实力将会显著高于其竞争对手。所以,竞争对手往往会想方设法的获取数据,而将用户数据泄露或出售的行为往往可以让数据存储服务商获得巨大的利益。 用户数据被收集后,中心化的存储使用户数据暴露在巨大的风险之下(泄露、黑客攻击等)。CSO 统计了自2000年以来最重大的 18 起用户数据泄露事件,尤其是最近两年,而且数据泄露量级也在呈指数级上升,不论是黑客攻击等外因,还是中心化存储方恶意的内因。例如,印度10亿公民身份数据库Aadhaar被曝遭受网络攻击事件、Facebook剑桥分析公司事件等。 由此,去中心化存储的商业模式就应运而生了。 去中心化存储基于区块链技术,通过非中心化的架构结合中心化与去中心化各自的优势在效益与公平之间探索平衡点,使存储的安全性提升;同时,通过区块链外存储和API接口的中心化处理,使得存储网络的TPS在现有公有链和联盟链的基础上得到大幅改善;并且,通过对种子节点或文件上传方实施激励措施,让其数据价值化。
1.2. 去中心化存储定义的内涵与外延 存储市场的商业组织形式可以分为中心化存储和去中心化存储。中心化存储是将数据完整的存储在中心化机构开发的服务器上,去中心化存储则是将数据切片分散存储在多个独立的存储供应商上。二者的技术实现方式通常会以分布式存储来体现。分布式存储是一种数据存储技术,它是将数据分散的存储于多台独立的机器设备上,通过纠删码(Erasure Encoding)技术实现数据的冗余存储。分布式网络存储系统采用可扩展的系统结构,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,解决了传统集中式存储系统中单存储服务器的瓶颈问题,并提高了系统的可靠性、可用性和扩展性。 需要注意的是,分布式存储仅仅是一种存储的技术方式,而中心化或去中心化存储是存储的商业模式。因为设备服务器与存储供应者是一对多的关系,即一个存储供应商可以控制多个存储节点,所以去中心化存储一定会使用分布式存储技术;但是,中心化存储可以使用分布式存储技术,也可以不使用分布式存储技术。
1.3. 去中心化存储的价值主张 去中心化存储代表着大规模存储的效率和经济的根本转变,它的价值主张主要体现在以下几个方面: (1)增强安全性和用户隐私。去中心化存储对数据的加密处理不仅仅局限于用户和软件终端,而且在存储网络所有环节上都在进行加密处理,并通过私有网络访问密钥、零知识证明等方法保护用户隐私。 (2)存储平台或网络的算法和代码必须是开源的。由于2C端的存储服务已经被中心化存储抢占了大多数市场,由于在开源项目初期进入门槛较高,大多数集中于2B端,只有代码开源才能让社区和应用的完善形成有效的正反馈效应。如果算法和代码不公开透明,则存储网络就会变相的中心化。 (3)通过冗余备份防止数据丢失。数据存储于不同的节点,通过数据冗余防止数据丢失(在数据存储或传输出错时存储额外的副本)。
2 去中心化存储系统的架构与运行 2.1. 去中心化存储的工作原理 在文件共享方式上,去中心化存储系统文件共享方式与中心化存储截然不同,中心化存储系统的大型文件上传后,文件以整体或切片的形式存储在单一或分布式的网络或服务器上,需要及其高效的开发、运营团队来维持其运转。 然而,去中心化存储必须使用分布式存储技术,初始种子节点(最初拥有完整文件资源的节点)在将大型文件进行切片处理后,使其产生多个Pieces,每个Piece分别存储在不同的节点上,每个一般节点在下载单个Piece并上传到去中心化存储网络中让其他节点下载后成为这个Piece的种子节点,在多个节点完成相互共享Piece的过程中,实现Piece在除初始种子节点之外的节点共享,并不断扩大该文件共享网络中的节点数。所以,在同一时刻其他条件不变时,随着下载人数的增多,下载同一内容的速度越快。因此,去中心化存储系统弥补了中心化存储系统传输速度慢的缺陷,同时克服了单点故障并保证了数据的安全性。
2.2. 去中心化存储的架构 去中心化存储架构自下而上有4个组成部分:网络协议(TCP/IP)、区块链或分布式账本、去中心化存储协议和应用程序。 其中,网络协议对应的是Layer 0;区块链或分布式账本对应的是Layer 1的底层加密和共识机制;去中心化存储协议对应的是Layer 1的激励机制设计和身份协议,以及Layer 2对接各类应用程序的智能合约、脚本语言和API接口等,直接对接各种服务应用,一般以API或者是智能合约的形式呈现;应用程序则对应的是Layer 2的应用层。 图片: https://uploader.shimo.im/f/8nkiFCFh56vwrKOQ.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo 2.2.1. 网络协议与网络层 网络协议包括TCP/IP的网络协议、存储网络和传播机制。网络拓扑结构的搭建和设计方式往往代表了该系统的价值目标的实现方式,决定了其传播机制和验证机制的运行效率。 存储网络的拓扑结构可以是P2P网络,也可以是存在几个联盟的中介服务商或运营商的去中心化网络(本文将此网络拓扑结构定义为非P2P网络),但不包括单一或寡头中心化存储服务商构建的基于多个服务器的分布式存储网络。 对于P2P网络,所有的节点都是对等节点(Peers),它们具有平等的权利和义务,去中心化程度是最高的,也是BitTorrent、IPFS和Storj等主流去中心化存储项目的网络结构模式,任何节点都可以通过租用和自身的磁盘等硬件为用户节点提供存储空间,也可以通过支付代币或免费的形式将数据分片存储到不同的对等节点上,交易的过程是可逆的,每个节点获得记账权的概率是均等的。对于非P2P去中心化存储网络,存在部分中介节点,服务器没有充分分散化和边缘化,类似联盟链(许可型区块链)的网络结构,交易信息的传播和沟通必须经过这些中介节点,中介节点与一般节点在权利与义务存在一定的不对等[2]。 传播机制方面,P2P网络传播延迟小于非P2P网络,并且更容易扩大规模[3]。假设对同一个内容存在一个非P2P共享存储网络(网络A)和一个P2P共享存储网络(网络B),A和B中均有100个节点,其中A存在20个中介节点,B存在100个对等节点。从主观能动性上来说,因为网络B更容易扩大规模,节点上传文件分片(Pieces)的动力强于A;从客观规律性来说,即便网络A和网络B的节点数拥有保持在相等的状态,由于存在网络A存在中介节点,仅有中介节点充当种子节点的角色,其他80个节点就会有搭便车(只下载资源不上传资源)的行为,完全起不到作用,从而导致网络传播延迟大于网络B。 验证机制方面,P2P网络的验证动力明显强于非P2P网络。P2P网络可以通过设置奖励代币的方式,激励大量的节点自发地去验证前面交易的真实性,寻找相应证据来佐证;而非P2P网络中,具有足够验证动机的节点仅有少数联盟的中介节点,其他节点因利益分配不均缺乏其他交易真实性的动力。显然,从发动51%攻击、女巫攻击或者镜像攻击的难易程度上,P2P网络显然比非P2P网络具有更高的难度。 2.2.2. 区块链或分布式账本 去中心化存储系统的区块链或分布式账本自下而上一般包括加密基础设施、交易记录、广播方式和存储证明机制。 对于加密基础设施,其加密方式一般是通过哈希函数加密,包括SHA-1、SHA-256等算法或配置表(Allocation Table)连接到默克尔根,在每个环节对数据加密处理后,再通过分布式哈希表(DHT, Distributed Hash Table)、追踪服务器(Tracker)等方式通过主键(Key——种子文件地址)检索到特定存储内容的共享网络。 对于存储证明机制(PoS, Proof-of-Storage),一般是在不通过下载内容的情况下,证明服务器在特定时刻已经存储了特定下载内容,及其数据的完整性,从而降低恶意节点的舞弊空间。它包括数据持有性证明(PDP, Provable Data Possession)和可恢复数据证明(PoR, Proof-of-Retrievability),但是不同项目针对不同的作恶动机和方式对该共识机制进行了完善。比如IPFS通过复制证明(PoRep, Proof-of-Replication)和时空证明(PoSt, Proof-of-Spacetime)两个方式分别遏制了女巫攻击、生成攻击和外源攻击。 对于交易记录,交易记录一般都是以抽象化的形式加密后记录在链上,交易记录的发生与记录必须在完成存储证明之后,将文件名称、时间戳、文件类别等信息组成区块头并存储在链上。
2.2.3. 去中心化存储协议 去中心化存储协议是整个系统的核心,包括存储协议、检索协议、激励机制和身份协议。其中激励机制和身份协议处于其下层,一般在Layer 1(链上);存储协议和检索协议则属于服务层,包含各类智能合约和脚本文件,从而决定了相关应用程序的设计,一般在Layer 2(链下)。由于去中心化存储项目的定位不同、进展阶段不同等多方面的因素,导致其去中心化存储协议在不同维度的设计上存在较大差异。 身份协议方面,分为存储用户的身份和节点身份。存储用户的身份一般以去中心化身份(DID, Decentralized Identity)的形成呈现,但是也有BitTorrent中心化身份的特例。用户仅仅只在提供最小化满足功能的个人信息的情况下,拥有对自己的身份及其相关数据的控制权、许可权和收益权;节点的身份一般在检索过程中,以哈希字符串的形式存储在链上,通过追踪服务器或哈希表可以有效查询某一特定文件或文件集的种子节点,一般表现形式为URL。 存储协议方面,协议指出用户节点以支付代币或免费的方式从种子节点下载其感兴趣的文件或文件集,而其对手方节点通过提供存储空间(购买或租用)或带宽资源来赚取代币或获得更高的获得记账权的概率,进而形成一个双向的智能合约或交易订单。首先,文件或文件集需要做切片处理,经过2.1节中的流程后,存储磁盘空间由该内容的共享网络(Swarm)中所有的节点提供相关的分片。存储协议中所有的步骤流程均在链上进行,包括订单的生成、共识机制的验证和价值传递等。 检索协议方面,去中心化存储的检索协议一般在链下执行,并由中心化机构进行开发、维护和运营,仅仅只有存在代币经济体系的情况下,其价值传递仍在链上进行,其记录抽象化加密后记录在区块链或分布式账本上。检索方式一般是通过节点身份(URL形式)对种子节点和共享网络进行检索,通过中心化检索服务器和DHT(分布式哈希表)的方式使下载者之间连接起来,进行资源检索。而DHT是对Tracker检索方式的改进,通过Key(通过检索内容的哈希函数生成的哈希字符串)对特定内容进行检索,并大大提升了检索效率。
2.2.4. 应用层 应用层一般包括存储客户端软件(包括存储功能和检索功能)、加速软件和用户代理程序等。通过SaaS(Software-as-a-Service,软件即服务)的方式实现盈利,应用软件及其相关基础设施在Layer 2(链下)。客户端软件一般与用户进行直接交互,它本质上是一个数据传感器,用来记录用户在存储网络中的行为,评估其转化率、活跃用户数(日活和月活)、搜索记录等,从而为项目未来的发展与经营提供有效参考。通过DID(去中心化身份)的模式让节点实现数据暴露最小化,使去中心化存储客户端仅仅在实现功能的基础上对用户的存储行为进行画像,而不反映存储和检索功能之外任何的数据信息。
3 去中心化存储与中心化存储的比较 3.1. 比较分析 图表8:中心化存储VS去中心化存储 图片: https://uploader.shimo.im/f/AOnL71L9UMCMqAxM.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo 数据来源:HashKey Hub
3.1.1. 存储空间和带宽来源的差异 中心化存储指由单一或寡头第三方机构利用自身搭建的服务器对外提供大规模数据存储服务的商业模式;去中心化存储指大量普通PC服务器通过Internet 互联,对外作为一个整体存储服务。 中心化存储的空间来源是由指定存储服务提供商开发和运营的存储云端,比如Amazon S3、阿里云和华为云的服务器等,下载的带宽由服务供应商提供;而去中心化存储空间来源是大量能够提供存储空间的PC、移动终端等设备,同一文件或文件集的共享网络中的所有节点都可以为其下载提供带宽。
3.1.2. 使用方式的差异 由于存储空间的来源不同,进而导致文件存储方式和检索方式截然不同。 存储方面,中心化存储由于存储空间是由中心化存储服务商开发并运营的,因此文件存储空间容量足够大,以至于可以存储海量数据,存储文件(不论是文本、语音还是视频等)整体存入云端,不需要对文件进行切片和去重的处理;去中心化存储由于存储供应者(服务商或个人)相对分散,存储空间也相对分散,需要相应的匹配优化算法在冗余的存储空间中寻找最优的存储空间提供者(即以最快的速度存储并合适的存储空间)。并且为了保证存储数据不会因单点攻击或故障、女巫攻击等外部性因素而丢失,去中心化存储系统在进行加密处理后将文件进行切片处理,并分散存储至不同的存储提供者的磁盘空间中。 内容检索方面,中心化存储以账户范式的形式对已存储数据进行访问,通过输入HTTP URL的方式连接到追踪服务器(Tracker),从而实现搜索特定存储内容;去中心化存储因为数据分散存储在不同的节点,所以需要通过DHT分布式哈希表将每个节点的链接用哈希函数生成哈希字符串,因此其下载速度随着下载的人数增多而加快。但是也造成了数据的大幅度冗余,很容易造成存储空间资源(如磁盘等)和带宽的浪费。
3.1.3. 安全性和隐私保护的差异 去中心化存储和中心化存储在安全性和隐私保护上具有各有优劣。去中心化存储的优势主要体现在以下两个方面: 一方面,去中心化存储规避了单点故障和部分节点断网或不可用等风险。由于去中心化存储的共享网络为P2P网络,而中心化存储的共享网络为以服务供应商为中心的中心化网络,从而导致前者不容易受到单点故障和服务器断网的影响,也不容易受到黑客的攻击。 另一方面,去中心化存储使用户的具体存储内容不因主观原因而泄露。去中心化存储通过零知识证明和非对称加密等技术,将哈希加密的字符串放在区块的最底层,连接到默克尔根,从而将存储内容的分片实现加密处理,其他任何节点包括运营商都无法看到存储的具体内容;而Amazon S3等中心化存储系统则通过账号范式,其具体内容服务商都可以看到,从而导致大规模云泄露和云安全事件频发,用户的隐私无法得到有效保障。 但是去中心化存储的劣势也很明显。采用非许可型区块链技术实现去中心化存储模式时,由于出块的全网广播和时间戳技术,导致所有参与节点都知道某一节点在某一特定时刻存储数据,随着节点之间的交互频率提升,全节点可以很容易查找交易发生的区块,从而暴露Hash值背后的身份,并用算法推测请求方或存储方的存储余额。再加上分散存储,每个片段如果都一般为64-512KB,一旦存储网络的大多数存储空间掌握在少数几个存储供应商手中,会比文件整本存储更容易被破解。
3.1.4. 存储费用结构的差异 由于中心化存储系统和去中心化存储系统的存储方式和检索方式的差异,导致二者在服务费用定价上存在差异。 中心化存储系统的收费标准是按月度、季度或年度为单位根据存储数据文件的大小收取存储费用,并且对存储费用实施一定的促销策略(免费试用期等)。比如Amazon S3收取存储费用为每月0.03美元/GB;阿里云针对个人和企业采用差异化定价的方式:个人收费为每月10元/GB,企业收费为每月2.5元/GB。 由于大多数去中心化存储网络平台处于项目运营初期,大部分产品处于开发阶段或MVP阶段,因此以低廉的存储费用来吸引用户流量。但是,相比较中心化的相对固定的服务费用,除了存储费用之外,去中心化存储还有检索费用、手续费和交易费。因此,去中心化存储仅仅适合冷数据存储,在检索数据量较少的情况下其费用比中心化存储低得多。而对于热数据,因检索频繁导致其成本可能高于中心化存储的费用。对于去中心化存储,因存储共享网络在扩大规模的同时必须伴随着检索热度的增加,而搜索热度的增加必然伴随着检索费用的上升,这在某种程度上是一个难题与挑战。
3.1.5. 可用性的差异 可用性方面,中心化存储在当前状态下具有显著优势。 一方面,中心化存储的文件存储形式采用整本上传,其数据完整性优于去中心化存储。一般来说,可用性的度量维度是客户端直接可用的文件(或文件集)的完整副本数。比如说对于种子节点,因其已上传完整的内容资源,所以其可用性为1,而对于去中心化存储分片后将不同的Piece存储在不同的节点,其共享网络中的单个节点的可用性通常小于1。 另一方面,中心化存储由一个或寡头的服务供应商运营并维护其共享网络的可持续性,特定共享内容网络的持续期较长。其HTTP URL的有效性在上传者不主动删除的情况下,链接将永久有效;而去中心化存储在存储内容可用性的可持续性上比较短暂,主要原因是缺乏有效的激励机制。
3.1.6. 存储文件大小与类型的差异 中心化存储在存储文件大小与类型没有任何限制,不论是视频、音频、文档都可以上传和存储,具有显著优势。 去中心化存储不同项目存在不同的适合存储的文件类型和大小,比如Storj定义小文件是1MB以下的而大文件是4MB以上的。显然文件越大切片的难度也就越高,有些去中心化存储网络只能存储文本文档和图像,有些则可以存储视频和音频,导致市场相对分散。 去中心化存储可减轻数据故障和中断的风险,同时提高对象存储的安全性和私密性。它还使市场力量能够以比任何一家单一提供商都无法承受的更高价格优化价格更低廉的存储。尽管有很多方法可以构建这样的系统,但是任何给定的实现都应该解决一些特定的责任。基于我们在PB级存储系统方面的经验,我们引入了一个模块化框架来考虑这些责任并构建我们的分布式存储网络。 另外,我们描述了整个框架的初始具体实现。而对于大型文件(一般大于1GB),在通过哈希加密产生的字符串太多,以至于用户无法记住其哈希字符串,从而导致去中心化存储对用户的接受性减弱。
3.1.7. 下载速度评估方式的差异 去中心化存储和中心化存储在对下载速度评估上存在显著差异。 中心化存储通过中心化的服务器为用户提供带宽进行下载,只要缴纳会员费或者提升会员等级就可以显著提升下载速度,比如用户在使用百度网盘时,在没有会员的情况下下载速度仅为200KB/s,而在成为会员的情况下下载速度高达2-5MB/s,而且还会有限速措施;去中心化存储的下载速度取决于其贡献程度,即该节点当前上传内容分片的数量,在其他条件不变的情况下,种子节点的数量越多,下载的人数越多,上传的内容越多,其下载速度越快。同时,对“只下载,不上传”的搭便车节点以限速的形式进行适当的惩罚[5]。
3.1.8. 发展程度的差异 中心化存储市场占主导,处于成熟期;去中心化存储仍然处于初创期,技术架构和体系尚未成熟。 从行业周期理论角度出发,行业的发展阶段分为初创期、成长期、成熟期和衰退期。存储市场总收入规模达到了130亿美元以上,中心化存储2019年上半年目前已经形成了寡头垄断的竞争格局,以Dell Technology、H3C、IBM、联想、华为等巨头为主,并且前10家中心化存储公司的市场份额达到62.9%。 而Sia、BitTorrent、IPFS等去中心化存储项目部分仍在开发阶段,而且进度较为缓慢,而开发完成的Sia和Storj的存储空间总量仅为2PB,而实际使用空间仅为全网总存储空间的40%不到,与中心化存储的收入相去甚远。
3.2. 去中心化存储的挑战 相比较于中心化存储,去中心化存储虽然在隐私保护和安全性上具有一定的优势,但是在技术、治理、激励机制等方面仍存在诸多不足,比如对于大型文件的用户体验减弱、费用不稳定、激励机制设计上存在规模与效益的矛盾等。因此,未来去中心化存储市场需要引入稳定的费用定价、建立恰当的激励机制等方式来逐步完善,在保持安全性的优势基础上,实现规模与性能的兼顾。 接下来将简析现有的去中心化存储项目,并对其优缺点进行相应评价。
4 去中心化存储项目简析 4.1. 代表性项目 目前,已经部署的去中心化存储项目无法从单一的维度进行分类,每个项目都有各自的特点,只能在大致上进行初步划分。 按功能实现的模式划分,以BitTorrent、IPFS和Lambda为代表的项目更加偏向于基于内容寻址的文件共享网络,而以Sia、Storj、MaidSafe为代表的项目则更加偏向于提供电子网盘。 BitTorrent是最早的去中心化存储项目,但是因其大部分缺乏激励机制,只有少部分引入了TRON网络的BTT经济,所以作为去中心化存储模式的雏形;IPFS则是去中心化项目中融资额度最大的,累积融资额高达2.57亿美元,通过出块奖励、手续费和服务费等方式激励点对点存储,并通过优化的Kademelia算法匹配存储的供应和需求;Lambda在IPFS的基础上引入了TBB经济,通过质押TBB代币变相地降低了存储矿工的进入壁垒;Storj和Sia更倾向于提供电子网盘,不要求实际存储,只要提供足够的存储空间就可以挖矿;Sia则是通过内置智能合约的方式为P2P存储网络中不同的节点提供协商和沟通的空间。 图表10:代表性去中心化存储项目比较 图片: https://uploader.shimo.im/f/TDi3xa3V2KfaaQpc.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo 数据来源:HashKey Hub 4.2. BitTorrent——去中心化存储项目的雏形 (1)项目介绍 BitTorrent简称BT,是一种开源的内容分发协议,由布拉姆科恩于2003年自主开发[6]。它采用高效的软件分发系统和点对点技术共享大体积文件(如一部电影或电视节目),并使每个用户像网络重新分配结点那样提供上传服务。常用的应用软件包括BitTorrent、μTorrent等。 (2)工作原理 BitTorrent的工作原理与一般的去中心化存储协议无差异,如上文2.1节阐述,将文件进行切片处理,再将每个Piece分割成多个大小为64-512KB的块,每块生成一个哈希字符串,然后利用SHA-1算法加密后分发给该文件或文件集的共享网络(Swarm)中的各个节点。具有完整文件的对等节点为种子节点,其他为非种子节点。然后,共享网络中的所有节点相互传输文件资源,让更多的节点变成种子节点,并且通过Opitimistic Unchoked算法选出2个共享网络外的节点,以扩大共享网络。 (3)项目架构 图表11:BitTorrent自下而上的架构图 图片: https://uploader.shimo.im/f/GMgYTJ2AjmVfsMSd.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo 数据来源:HashKey Hub
BitTorrent的架构采用“P2P+中心化”的双层模式进行布置,其中存储共享网络采用P2P的模式,而检索协议采用中心化检索模式,其索引文件后缀为”.torrent”。 检索方面,正如本文2.2.3节所述,BitTorrent检索中以加密后的链接为节点的身份,采用哈希分布表对接追踪服务器的模式对特定存储文件或文件集进行有效检索。其中,Torrent文件包括Announce和info两个部分组成, Announce为检索所需的URL,其数据类型为字符串;info是一个字典型的数据,其索引包括Name(内容名称)、Piece Length(每个切片的字节大小, 除了最后一片,其他等分)、Pieces(利用SHA-1哈希加密后的每个Piece,以便于通过hash验证)、length or files(内容是单一文件还是文件集)。 存储方面,通过对特定Torrent文件切片后分散存储在不同节点上,在此之前必须通过Tit-for-Tat(TFT)的激励机制来筛选该内容共享网络中的节点。BitTorrent将该内容共享网络中的所有节点分为阻塞节点(Choked)和非阻塞节点(Unchoked),只有非阻塞节点拥有足够的速度或带宽下载或上传该内容,而阻塞节点则无法传输内容。通过以下三种情况将被判定为阻塞节点: (a)贡献过少或搭便车过多(只下载不上传)而因此被列入黑名单的节点; (b)接受节点本身就是种子节点; (C)存储空间已经满负荷的节点。 在TFT(Tit-for-Tat)算法配合的激励机制下,一方面根据以上判定方法在该内容的共享网络中确认阻塞节点,共享网络中的其他节点为非阻塞节点,再随机抽样出2个共享网络外的节点作为乐观非阻塞节点(Optimistic Unchoking)。一方面,遏制了该共享网络内节点搭便车(Leech)行为;另一方面,有利于共享网络的扩大。 (4)项目评价 BitTorrent项目作为最早的分布式存储项目,在激励机制和共享网络上的设计上是比较成功的,并通过免费的模式让其普遍受到用户的青睐,并且通过P2P网络实现了下载人数越多速度越快的目标。 但BitTorrent仍存在一定的改进空间。首先,BitTorrent只能将该激励机制局限在同一内容的共享网络范围之内,而对用户下载后保持内容的可用性方面缺乏有效的激励手段;其次,因BitTorrent的协议开源导致盗版猖獗,甚至通过该网络传播暴力、色情等不良内容,从而导致部分重视知识版权的国家(如法国等)全面禁止使用BitTorrent;再者,BitTorrent对贡献带宽高的节点不公平,在其他条件不变时,节点贡献的带宽越高,TFT算法的时延越长,下载速度的边际增长越低[7]。
图表12:下载速度随着带宽的提升而边际递减 图片: https://uploader.shimo.im/f/K92y3p5eoXV0wI8D.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo 数据来源:http://bittorrent.org/bittorrentecon.pdf
4.3. IPFS——融资额度最高的项目 (1)项目介绍 IPFS本质上是一个底层的开源文件传输协议,旨在对基于HTTP URL检索协议进行补充甚至替代,其代币为Filecoin。虽然Filecoin目前尚未正式在交易所上市或者发行,但是Filecoin期货早在2017年8月上线。Filecoin在上线之初就获得超过2.5亿美元的融资,其融资额远超其他去中心化存储项目,目前项目处于开发阶段,Protocol Labs目前对Filecoin激励机制和经济模型的仍在处于开发阶段。 (2)项目架构 图表13:自下而上的IPFS架构 图片: https://uploader.shimo.im/f/wSiO618zALGPXz4g.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo 数据来源:HashKey Hub
架构最底层为Libp2p,包括路由层(网络协议)和交换层(P2P网络),确保数据能够在点对点网络上实现点对点的传输。 上一层为Multiformat,用于加密数据并将数据抽象成放在链上的格式,它本质上是一个针对未来系统的协议集合,通过增强的自我描述格式(包括自我描述的哈希值、网络地址、编码值、序列化值、网络传输流和分组网络协议来实现互操作性并避免被锁定。 再上一层是Filecoin协议作为激励层,该协议包括链上存储市场、链下检索市场和Filecoin区块链三部分[4]。存储市场方面,矿工通过抵押Filecoin租用或购买存储空间,接着用户向其发起定向存储请求,并生成bid(用户)和ask(矿工)双向订单,并进行PoRep(复制证明)和PoSt(时空证明),最后用户获得有效存储(完成两种共识后的存储大小),矿工获得存储费用,注意不论是订单、交易记录还是Filecoin的价值转移全部在链上完成。检索市场方面,用户先发起检索请求,接着矿工获得检索订单并提供检索服务,最后用户通过支付Filecoin获得服务,注意仅有Filecoin的价值转移被记录到链下,其他均在链下完成。Filecoin区块链方面,分为订单簿(Orderbook)、交易记录(Transactions)、配置表(Allocation Table)。其中最底层的配置表通过连接到默克尔根对链上信息加密,用于存放双方的数字签名,对矿工发起质询并接受其回复;交易记录用来实现Filecoin的价值转移功能;订单簿用来记录存储订单。 图表14:自下而上的Filecoin架构 图片: https://uploader.shimo.im/f/STIQu91K8cFF6m5t.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo 数据来源:《Filecoin白皮书》 IPLD包括命名层、对象层和文件层,用于定义和查找数据,从而实现文件从命名到编程再到检索的过程。对于命名层,IPFS通过IPNS使在文件名变更的情况下锁定到其最新状态,它采用自我认证证明的方式,给每个用户分配一个可变的命名空间(路径为/ipns/),用户可以在此路径下发布一个用自己私钥签名的对象,当其他用户获取对象时可以检测签名与公钥和节点ID(IPFS之前生成的链接)是否匹配;对于对象层,IPFS使用Merkle DAG技术,构建了一个有向无环图数据结构,用于存储对象数据,通常由Base58编码的散列引用,该数据结构具有内容可寻址、防篡改、重复数据删除的特点;对于文件层,将大于256KB的数据文件分割成多个块(每块256KB),每块的数据类型为blob对象,list对象由几个blob对象组成(可能重复),而Tree则是一个json格式的从名字到哈希值的映射表,由于Tree比blob小从而便于通过DHT进行检索。 (3)项目评价 IPFS在治理上采用了PoRep和PoSt的证明有效遏制了女巫攻击、生成攻击和外源攻击等投机行为,并且通过强制购买GPU矿机使PoSt可以在每隔45s可以证明“任意节点是否在该特定时刻已经存储了某一特定大小的文件”,通过默克尔树让每个文件分片(Piece)保留一个根哈希值,大大减少了数据冗余。但是因项目处于初步公测阶段,仍有以下几点值得探讨: (a)IPFS的市场非常小众,仅仅是对私存储(因为容量有限),并且由于GPU矿机的挖矿成本较高,家庭户无法直接参与到存储挖矿,只能参与检索过程并赚取服务费,仅仅只是对大型规模的矿池或者合伙存储供应商具有较大吸引力,从而不利于全网总存储集中于少数存储供应商或矿池分散化,容易陷入Filecoin供过于求的困境; (b)如果数据量较大(超过1TB),用户必须记住和保留多个根Hash值,从而不利于用户体验,如何控制少数家庭用户的流失率将会成为IPFS发展的挑战; (c)与BitTorrent相比,即便IPFS初期存储免费,检索费用根据数据热度决定,不提供永久的存储,仅仅只是租用存储空间,高额的存储费用和检索费用以及高投入(GPU矿机)导致用户门槛巨高; (d)IPFS网络没有特定服务器的P2P节点,效率有待于进一步加强; (e)无法充分遏制存储矿工上传大量垃圾数据作为有效存储的行为; (f)PoRep共识机制决定了无法进行全网校验,付费存储的方式才可以进行挖矿,如果规模扩大,由于Filecoin的出块率等于挖矿节点的有效存储除以全网总存储量,挖矿难度将会大增,无法赚取收益,容易陷入价格战。
4.4. Lambda——基于IPFS的延伸 (1)项目介绍 Lambda是一个区块链数据存储的基础设施,通过对Lambda Chain和Lambda DB的逻辑解耦和分别实现,通过Dapp提供可无限扩展的数据存储能力,并实现了多链数据协同存储、跨链数据管理、数据隐私保护、数据持有性证明、分布式智能计算等服务。 (2)项目架构 Lambda包括Lambda Chain(同构多链的链系统)、Lambda DB(同构多链的链系统)、Lambda Agent(提供内存数据存储、性能监控、安全监控和Metrics数据上传能力的探针系统)、Lambda P2P(提供数据检索功能)[8]。Lambda采用链库分离的架构设计的原因有二: (a)因为区块链系统更新导致分叉,所以将主要数据处理能力放在数据库(Lambda DB)上; (b)通过功能子链保证其可扩展性,从而实现隐私保护(基于多授权机构属性加密)和数据持有证明(PDP, Provable Data Possession)。
图表15:链库分离的Lambda架构 图片: https://uploader.shimo.im/f/5X22SQetgMordxXE.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo 数据来源:《Lambda白皮书》
(3)经济设计 Lambda项目采用LAMB和TBB双层代币的方式分别对存储挖矿和质押存储实施激励和惩罚手段。其中,LAMB是原生代币,用于区块奖励发放,流通、支付交易手续费和生态应用费用结算;TBB则是存储网络的存储空间资产,主要作用是质押和锚定存储资产权益。 Lambda网络中主要角色有5个:存储矿工(提供存储空间)、验证节点(负责运营和维护共识网络)、存储资产做市商(为存储矿工提供存储资源流通性)、合伙人节点(负责生态建设,不参与存储网络)、出块节点(由验证节点结合质押容量量按照权重选出,负责区块数据的打包以及共识的发起)[9]。 出块奖励有2种:对于存储挖矿方面,43%的出块奖励给矿工及其验证节点;对于质押挖矿方面,50%的出块奖励给矿工及其验证节点。二者的区块打包收益则根据该验证节点收集投票的多少决定打包区块收益(出块总奖励的1%-5%),社区收益占总收益的2%,验证人可以自定义佣金费率。 当验证节点对区块进行双签、对近10000个块中少于500个签名、质押少于666.66TBB时会受到“扣除质押TBB和提出验证节点候选人”的惩罚。 (4)项目评价 Lambda通过非中心化的方式,在存储做市商和数据库上以中心化的形式部署,大大提高了全网的数据吞吐量,使网络未来的可扩展性大大增强。它本质上是IPFS项目的延伸与扩展,并且通过引入TBB抵押存储机制降低了使用门槛,但是仍然不利于家庭用户参与到存储挖矿。 但是,Lambda仍有值得商榷的地方。比如Lambda通过NPoS(Nominated Proof-of-Stake)和PDP(Provable Data Possession)的存储证明机制无法证明存储矿工恶意存储大量垃圾数据从而提升其打包概率赚取LAMB的行为,一旦验证节点候选人被“黑化”,甚至全网总存储份额无法得到充分稀释,使51%攻击的难度较低,大多数挖矿的收益集中于少数人手上,从而导致用户的存储需求和质押需求大幅下降,从而导致LAMB逐渐供过于求,导致LAMB兑美元大幅下跌和贬值。
4.5. Storj ——基于ETH网络的分布式存储协议 (1)项目介绍 Storj 是一个基于以太坊的分布式云存储协议,由盈利性公司Stroj Labs开发,旨在利用未使用的硬盘和带宽,让P2P网络上任何节点之间都可以进行磋商、数据传输、验证数据完整性和可用性、检索数据、价值传递,存储节点通过提供存储空间收取租金,而其对手方承租磁盘空间支付租金。当前,Storj全球总存储量已经超过了150PB,存储费用为每月0.015美元/GB,下载1GB所需的带宽费用为0.05美元。 (2)Storj协议架构 Storj协议包括文件切片处理、Storj网络、PoR证明机制、支付协议、广播协议。对于同一内容的共享网络,节点分为存储节点、卫星节点和上连节点[10]。 存储节点方面,通过出租磁盘和提供带宽而赚取Storj代币,如果没有通过随机审查,则该节点会从存储节点池中剔除,它们不为存储数据的初始传输(带宽入口)付费,不为节点发现支付任何费用,有效遏制了存储节点为了更多存储空间而删除原有存储数据的行为(延长内容共享网络的可用性的持续期)。存储节点将允许管理员在最近30天内配置最大的磁盘空间和每个卫星的带宽使用量,在跟踪以上2个指标后拒绝没有有效签名的操作。 文件切片和加密方面,对于特定文件集Bucket,每个文件可以根据特定路径进行检索。对每个文件,首先将其切分成多个Segments(分片大小由用户自定义),若某个Segment小于其元数据的大小,则节省了存储空间,该Segment被称为内联Segment。在通过AES256-CTR算法加密后,将加密后的哈希字符串拆分成多个Stripe,每个Stripe执行纠删码编码(通过调整原数据块和校验数据块的比例来提升网络节点的容错能力,使数据安全性提升),将相同索引的纠删码片段拼接组成一个Piece。最后,将每个Piece分发给共享网络中不同的节点,并通过指针实现对不同文件片段的检索。 Storj网络方面,为了使承租节点和存储节点进行磋商和交互,Storj将合约和磋商系统建立在Kademlia分布式哈希表上,以实现传递所需的确认信息最小化。通过增强核心Kademlia功能,传递Ping(确认节点是否在线)、STORE(在DHT上存入哈希值)、FIND_NODE(寻找DHT上有存储空间的节点)、FIND_VALUE(寻找DHT上的哈希值)四种信息,促进不同节点的交流。首先,如果某个节点要加入某个文件的共享网络,必须先创建一个公钥私钥对,Kademlia节点的ID必须与通过SHA-256加密后的公钥哈希字符串一致,因此每个节点的ID也是一个有效的比特币地址,在发送信息前必须通过数字签名对信息进行验证。 共识机制方面,Storj通过“质疑-回复”的形式来实现PoR(检索证明),确保远程主机确实存储了特定文件分片,并验证文件的完整性和可用性。Storj采用默克尔根和默克尔树的深度两个指标,通过验证其叶子集合的元素个数是否与默克尔树的深度相等,并且提供的哈希值会重新创建存储的根。通过执行简单的Tit-for-Tat模式,如果存储节点未通过审核或无法证明自己仍然有数据,那么承租节点就不必付款;如果租户下线或未能按时付款,则存储节点可以删除数据,并从其他人那里寻找新合同。 图表16:Storj文件存储工作原理 图片: https://uploader.shimo.im/f/TT9sZArncm8oHL9e.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo 数据来源:《Storj白皮书》
图表17:Stroj节点分类 图片: https://uploader.shimo.im/f/jtFsJrQBH73YWfb6.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo 数据来源:HashKey Hub
(3)项目评价 Storj在技术上通过Bridge客户端实现了对Amazon S3等其他存储格式的兼容,并且通过以美元计价的标准避免了存储费用的大幅波动,其存储费用远远低于中心化存储平台,并且通过Kademlia算法优化了检索模式,大大减少了数据的冗余和资源浪费。 但是有些地方仍值得商榷。首先,由于Storjcoin的波动率较高,从而导致存储节点获得的出块奖励大幅波动,从而无法在长期上保证更多的用户提供更多的存储空间。其次,由于缺乏有效措施延长文件可用性维持的时间,这将不利于共享网络的扩大。再者,随着Filecoin加入市场,Storj不具备显著的竞争优势和资金优势。更重要的是,Storj本质上只是完成存储资源的对接,缺乏有效的内容寻址方法,不利于文件共享(如电影、音频等),只是适用于大规模数据的存储(如监测数据、交易数据等)。
4.6. Sia——BTC在去中心化存储的变体应用 (1)项目介绍 Sia是一个分布式云存储协议,由Nebulous公司负责开发与运营,倾向于在P2P和2B端与现有存储解决方案进行竞争。Sia支持存储网络的对等节点之间形成合约,为下载特定存储内容定价,旨在让承租节点以更便宜、更快捷的方式租赁到合适的存储空间,通过Siacoin经济设计促进承租节点和出租节点双方达成一致。目前,Sia的存储空间总容量仅为2PB,已存储的空间仅为206TB,而存储节点为333个,累计下载总量仅为1.2MB。 (2)项目架构 交易结构方面,Sia交易包括协议版本号、Arbitrary Data(任意数据字段,以便于数据的检索)、矿工奖励、Inputs(收入资金)、Outputs(支出资金)、文件合约、存储证明、数字签名(所有输入都应当进行数字签名)[11]。Sia通过在所有交易中使用M-N多重签名方案,完全避开了脚本系统,减少了复杂性和攻击可能性。每个区块头的输入必须来自上一个区块头的输出,因此该区块的输入必须是上一个区块头的输出的哈希值,输出包含其Merkle根;Siacoin的支出条件是“时间锁定已经超且足够的指定公钥添加了它们的签名”,签名的数量、公钥组和时间锁定写入Merkle树的叶子节点,而该树的默克尔根作为Siacoin发送的地址,交易双方可以自主选择披露公钥的数量和签名的数量。 文件合约方面,文件合约是存储节点和其客户之间的存储协议,文件被分片成多个散列在哈希加密后,生成其默克尔根(合约的核心),根散列以及文件的总大小可用于验证存储证据。合约进一步规定持续时间、挑战频率和支付参数(有效证明的奖励、无效或缺少证据的奖励以及可以错过的最大证明数量)。其中挑战频率规定提交存储证明的次数,在挑战期间提交一份有效证明将触发转账交易;若没有在持续期内提供有效证明,合约将会发送到“错过证明”地址(有效防止DDOS攻击)。支付参数中“可以错过的最大证明数量”为1个阈值,如果错过证明数量超过该阈值,合同无效。 存储证明方面,存储证明仅需要合约的身份(哈希值)和证明数据。首先,通过原文件分片存储在默克尔树的叶子节点,生成的哈希根将与之前预先生成的根哈希进行对比,若二者相同,则可证明这些分片确实来源于原文件。Sia通过让客户端指定很高的挑战频率,并对丢失的证据进行大量处罚,从而阻止低于全网总算力50%以下的任何攻击,并遏制私自挖矿的行为。另一方面,由于用户节点有权拒绝任何交易,所以当恶意矿工人为以“是否将存储证明上链”为名来勒索高额交易费时,用户可以直接终止交易。 (3)项目评价 Sia协议本质上是BTC在去中心化存储的一个变体应用,但是其机制设计有些地方仍值得商榷。在Siacoin经济方面,Siacoin的发行数量是递增的,但是其增长率是递减的(初始区块产生30万个Siacoin,之后每产生一个区块减少1个Siacoin,直到减少到30000个区块,平均每10分钟产生1个区块),从而导致随着Siacoin数量的增加而带来较大幅度的贬值,从而导致其存储费用波动较大。对于挖矿体系来说,随着Siacoin的贬值与滥发,导致算力较强的矿工会产生不成比例的优势,最终挖矿人数将会大幅下降,不利于调动矿工参与的积极性。因此,Sia不论是从存储规模上还是交易效率上都远远低于Storj,更不用说和BitTorrent相比。
5 去中心化存储未来展望 5.1. 去中心化存储的发展陷入瓶颈或停滞 从严格意义上,去中心化存储并非真正意义上的去中心化,而是非中心化,比如Filecoin在存储方面是去中心化的,而在检索方面是中心化的。尽管中心化存储在隐私保护、收费标准、数据安全性方面存在诸多不足,但是去中心化存储由于法律因素以及经济设计等诸多问题,从而导致大多数去中心化存储平台的客户仍然十分小众,提供的存储空间远远小于中心化存储网络,难以满足数据大规模存储和检索的要求,与1.3节中提到的去中心化存储的价值主张发生严重背离。 以下两点主要原因导致去中心化存储网络难以做大: (1)存储成本不稳定,费用结构不合理 一方面,去中心化存储网络的存储成本存在较大波动性。比如Sia、MaidSafe和Lambda等项目因其代币波动较大,而且代币发行机制设计不合理,容易导致代币超发,从而导致其代币价格长期呈下跌趋势,进而导致存储费用和检索费用不稳定,从而导致用户流失率较高。另一方面,数据检索不是免费的,从而使费用结构不合理。尽管去中心化存储网络的存储费用远远低于中心化存储,比如Storj的存储费用仅为每月0.015美元/GB,远远低于Amazon的每月2.5美元/GB,但是如果考虑检索费用或者对数据检索和调用频率的话,那么去中心化存储费用很可能高于中心化存储的成本。 (2)利益多方冲突导致项目方的短期行为严重 为了克服传统非许可型区块链(如BTC、ETH和EOS)等可扩展性不足的缺陷,相当一部分去中心化存储项目采用非中心化的方式,比如Lambda在存储资产做市商的中介化与链下的Lambda DB和Filecoin检索协议的链下处理。但是,项目方和用户的利益在诸多情况下存在不一致,从而导致项目方的短期行为。存储网络规模的扩大和交易公平性往往是存在矛盾的,例如Filecoin的项目方为了短期扩大全网存储规模而基于有效存储占全网总存储的比例设计挖矿成功的概率,导致用户存储和挖矿的动力减弱,具有高存储空间的节点可以获得比线性增量更高的回报和收益,而项目方本身可能就会扮演具有高存储空间的角色,使去中心化存储项目的价值观出现扭曲。 (3)代币发行通胀率设计陷入两难 去中心化存储网络的商业目标是吸引更多的用户提供更多的存储空间,并且将存储空间的利用率最大化,而实现此目标的前提是保证代币的高流动性并且不让其币值稳定,但是这往往是矛盾的。如果代币发行的通胀率偏低,在未来一定时期内代币的发行量是递减的,很容易造成代币走向升值趋势,存储网络参与者倾向于囤积代币以实现资产增值,从而不利于维持存储市场的高流动性,全网存储总量将会受到抑制;如果代币发行的通胀率偏高,在未来一定时期内代币的发行量是递增的,很容易造成代币兑法币(一般是美元)长期呈贬值趋势,那么矿工的铸币交易产生的收益会大幅缩水,从而导致矿工买入磁盘的投入高于因提供存储空间产生的收益,若买入GPU矿机挖矿则更会入不敷出,从而导致进入项目壁垒较高。目前,MaidSafe、Storj、Sia和Lambda等项目陷入了第二种困境。 (4)如何快速稀释全网总存储的集中度 去中心化存储项目在初期,全网总存储将不可避免地集中在少数存储供应商手中,它们大多数以合伙人的身份参与到其中。全网总存储的大规模集中容易发生51%攻击,不论攻击方是单个存储供应商还是矿池,甚至是“多方合谋”。导致大多数家庭用户掌握的存储份额越来越低,导致存储区块链从“非许可型”变质成“许可型”,从而导致其代币的需求下降并陷入长期贬值趋势,全网的流动性大幅减弱,甚至大型存储供应商的流失。 5.2. 去中心化存储发展建议 针对5.1节的去中心化存储的发展瓶颈,我们对未来去中心化存储项目的布置提供以下参考建议: (1) 引入稳定币的机制使费用趋于稳定; (2) 检索应当免费; (3) 使用Hash加密时让区块头上的根哈希值与上一个区块头的根哈希值高度相关,让特定存储内容的共享网络的其他节点有更强的动力去验证其存储文件的完整性和可用性; (4) 设计合理的共识机制,让出块概率与提高有效存储总量呈线性正相关; (5) 降低提供存储的进入壁垒,让家庭用户可以以存储矿工的身份参与到存储网络当中,不要让过多的全网总存储集中在少数存储供应商的手上,建议以存储空间的绝对值为度量实施有效奖励,而非比例。
参考文献 [1]袁煜明,刘洋.《区块链技术可扩展方案分层模型》 [2]彭俊.复杂网络的拓扑结构及传播模型的研究[D].西安:西安电子科技大学.2009 [3]海沫,朱建明.区块链网络最优传播路径和激励相结合的传播机制[J].计算机研究与展.2019,56(6):1205-1218 [4]《Filecoin白皮书》: https://filecoin.io/filecoin.pdf [5] E. Adar and B. A. Huberman. Free riding on gnutella. First Monday, 5(10), 2000 [6]《BitTorrent白皮书》: https://dwz.cn/dKuhcIRR [7] Bram Cohen. Incentives Build Robustness in BitTorrent. bram@bitconjurer.org. 2003 [8]《Lambda技术白皮书》: https://dwz.cn/yktCaGCp [9]《Lambda经济白皮书》: https://dwz.cn/ftm1Wl6d [10]《Storj V3白皮书》: https://storj.io/storj.pdf [11]《Sia白皮书》: https://sia.tech/sia.pdf 高清PDF版原文链接:https://pan.baidu.com/s/1Ljg6ZWXFt6ychJpHdKUlbA 提取码:20cq
2、去中心化存储是什么? https://www.jinse.com/blockchain/870158.html 在大型、集中式的数据中心中存储数据,往往存在性能、可用性和可扩展性等方面问题,同时也会带来较高的资本或运营支出。而且,集中存储数据也极易受到复杂网络攻击。出于这些原因,企业开始寻求去中心化数据存储的方法。 去中心化存储可以把数据分布到多个网络节点,类似于区块链的分布式账本技术。存储供应商(托管主机)基于协约来存储客户数据,并定期地证明它们能继续提供存储服务,直到协约到期。 主机可以通过提交证明得到奖励,但是丢失证明会受到相应的处罚,这些证明在区块链上是公开、可审计的,网络自动保证存储合同的一致性,这就意味着,客户不需要去验证合同,他们只需要上传数据,其它的都交给网络去做;用户也可以将自己电脑硬盘的存储空间进行出租,同时将获得一定的token作为报酬,而拥有Token的人则可以租赁其他用户的硬盘存储空间,基于区块链技术的去中心化特征,这些来自全球的使用者们可以将自己的空余硬盘空间组成去中心化的网络,而这些空余的硬盘空间就变成了去中心化网络的节点。数据将被切割成小块,经过加密后,分散存储在众多节点上。
3、去中心化存储赛道核心项目全分析:Filecoin、Storj 与 Arweave https://www.fxajax.com/20210616220931.html 撰文: 小毛哥 @ FxAjax、咖啡 @ 头等仓 2020 年是去中心化存储领域关键的一年,就在未来两个月内,会有包括 Filecoin、Storj 在内的重量级去中心化存储项目发布产品进展。该赛道及该领域的核心项目值得关注。 以存储作为服务的商业模式由来已久,亚马逊公司在 2006 年开始推出 Amazon Web Services(AWS),将自己的服务器和存储空间租借给用户,降低了开发者创建并管理服务器基础设施的开销。 随着时间的演变,传统云储存服务虽不断改善功能,价格也愈加亲民,但近年来陷入一个瓶颈,即无法解决频繁的数据泄露问题、服务的限制性、运营商停运风险等问题。于是,想要从根本上解决传统存储商业模式的弊病,去中心化存储这一概念逐渐兴起。 去中心化存储网络(Decentralized Storage Network, DSN) 是一种通过分布式存储技术将文件或文件集分片存储在供应方提供的存储空间上的存储商业模式。
我们从应用的角度将中心化存储类项目分为两类: 第一种是以硬盘空间作为算力证明进行挖矿、对标比特币为主的货币类项目,这类型项目主要以包括 Burst、BHD 在内的 PoC(Proof of Capacity) 共识项目为代表; 第二种是以有效存储为算力挖矿来赚取租金,实际是提供存储服务为主的应用型项目,比如 Filecoin、Storj、Sia 等项目。 图片: https://uploader.shimo.im/f/IFG5yLl5oVqqaxEs.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo 采用 PoC(Proof of Capacity) 项目共识机制的项目主要对标比特币,以节约能源,更分散,更公平的挖矿等作为核心竞争力,旨在成为一个更好的加密货币。我们在本篇文章所要聊的去中心化云存储项目,指的是第二种存储应用型项目,而 2020 年也是该领域关键的一年。
为什么要关注去中心化存储领域? 基于以太坊的去中心化存储网络 Storj 宣布将于今年一季度发布正式版本,并公布了一系列可期待的新功能。备受瞩目的巨型项目 Filecoin 之前多次延期,现在也已经完成测试网一级阶段,即将开启测试网第二阶段,并计划于 3 月 23 日至 4 月 24 日之间启动主网。 首先,2020 年是去中心化存储领域关键的一年,该领域技术开发已有多年基础,虽然此前有多次跳票,但目前技术已趋于成熟,2020 第一季度将会有包括 Filecoin、Storj 在内的重量级去中心化存储项目发布产品进展,这些厚积薄发的项目竞争也有望带动整个领域的火热,并与其他区块链应用组合出更多全新用例。 其次,去中心化存储商业模式明确清晰,市场规模呈增长趋势,对于矿工来说,整个市场是有利可图的。若可以在 2020 年开始实现大规模商用,并随着 Web 3.0 生态的发展、对隐私和用户数据所有权的重视,今年将成为去中心化存储领域的技术突破和产品落地之年,下面我们就选取一些值得关注的项目,并分别分析其优势和劣势。
Filecoin Filecoin 自其 2017 年上线之初就获得超过 2.5 亿美元的融资,Filecoin 有可能是 2019 年凤尾、2020 年龙头,其计划于 2020 年第一季度上线主网也是今年区块链世界最值得期待的大事之一。Filecoin 有望带动整个去中心化存储赛道的火热。 我们分析该项目的优势: 项目体量巨大、资金充沛,目前生态系统完备,有利于扩大应用规模 Filecoin 网络主要由独立的数据存储矿工、检索矿工、以及雇用矿工的存储服务客户组成,存储服务的客户可以通过存储市场和检索市场这两个分布式的、可验证的、激励性的市场来雇佣矿工。Filecoin 与其互补的分布式网络传输协议 IPFS 都是由 Protocol Labs 开发。 作为去中心化数据存储网络,Filecoin 既是作为 IPFS 的存储层,也是 IPFS 协议的激励层,IPFS 是整个系统的应用层,两个协议共享多个功能模块。 IPFS 主要对标 HTTP 协议,旨在对互联网的超文本传输协议 (HTTP) 进行补充甚至替代。IPFS 的愿景非常宏大,希望充当 Web 3.0 的存储层并建立新的互联网架构。 目前有超过 50 亿个文件已上传至 IPFS,有超过 100 个区块链项目采用 IPFS 存储数据及文件,现已成为去中心化网络的重要基础设施之一。 图片: https://uploader.shimo.im/f/L0m27F9VEDBPedMt.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo
Filecoin 竞价撮合机制有利于降低存储服务价格 Filecoin 矿工通过提供存储空间,以有效存储作为算力,参与网络治理,竞争区块打包权。该网络有两种类型的矿工,一种是检索矿工,一种是存储矿工,检索矿工赚取检索费,而存储矿工赚取存储租金以及区块打包的奖励。以 Filecoin 的机制来说,整个网络通过区块奖励来支付矿工硬件成本,以此来提供存储服务,存储服务以竞价撮合交易,该竞价撮合机制有利于降低存储服务价格。 我们分析该项目的劣势: Filecoin 挖矿硬件要求较高,无法保证普通用户的参与度 Filecoin 团队此前公开用户参与其测试网的硬件信息,目前要求为打包 32GB 的扇区,需要至少 128GB,甚至 256GB 内存。虽然该要求不代表最终主网的硬件标准,但就该硬件要求来说,无法让所有个人电脑参与挖矿,整个网络有趋向中心化的各大机房、数据中心之争的风险。 另外,以目前 IPFS 网络的下载速度来说,要达到企业级服务的要求,其性能及速度还需要进一步提高。 运行 / 开发现状 Filecoin 于 2019 年 12 月 11 日推出公共测试网。Filecoin 已公布其完整的 2020 年路线图,目前测试网第一阶段已经完成,第二阶段测试目前尚未展开。该项目计划于 3 月 23 日至 4 月 24 日之间上线主网。 图片: https://uploader.shimo.im/f/6VravXJipXHHrHmm.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo 目前 Filecoin 测试网运行稳定,根据 Filecoin 测试网显示,截至 2020 年 2 月 5 日,区块高度为 42511,平均区块时间为 47 秒,全网总算力为 1.2 PiB。根据 Filecoin 最新发布的路线图,2020 年 1 月 17 日将会完成测试网第一阶段,该阶段主要对 Filecoin 进行一些基本功能测试、优化和 bug 修复。 之前 Filecoin 曾计划在 2020 年 1 月 20 日到 3 月 20 日的测试网第二阶段,进行 Filecoin 网络正式测试、验证和安全审计,并将启动可信设置,发布更新主网硬件测试配置,发布开发工具协作包。不过,考虑到中国的春节,该项目后来修正了测试网第二阶段的发布时间,提出不会在中国春节期间发布测试网第二阶段。Filecoin 表示,测试网第二阶段的具体启动时间将取决于 go-filecoin 和 lotus 实现之间互操作性测试的时间长短,目前具体启动时间有待确定。 图片: https://uploader.shimo.im/f/0Gphe62UihKhkglb.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo 了解更多参与 Filecoin 测试网的信息,可以查看这篇FxAjax对 Filecoin 团队的采访:《听 Filecoin 团队回应测试网上线你需要了解的核心问题》。
Storj Storj 创立于 2017 年 7 月,是一个基于以太坊的分布式云存储协议,由盈利性公司 Stroj Labs 开发。 Storj 旨在搭建免审查、免监控且不停机的去中心化云存储平台,通过利用闲置硬盘和带宽,在 P2P 网络上任何节点之间都可以进行磋商、数据传输、验证数据完整性和可用性、检索数据、并进行存储。 我们分析该项目的优势: Storj 的模式更偏向商业化,更适合企业级存储业务 虽然 Storj 提供基于区块链技术的存储服务,但该项目直接对标亚马逊的 S3 对象存储服务, 希望为企业提供各项性能指标都堪比、甚至超越亚马逊存储的服务。若项目进展顺利,Storj 将成为最具商业竞争力的去中心化存储平台之一。 Storj 的每个里程碑都是以量化的指标为主的,只有达到这些指标,Storj 才能进入下一个里程碑。Storj 的存储原理是将上传的文件先拆成 64M 大小的数据块,然后将 64M 大小的数据块,经过 2.7 倍的冗余,再切分成 80 个数据块。这 80 个数据块会分散到网络中的 80 个节点上。这样,只要保证这 80 个节点有任意 29 个节点在线,都可以完整恢复这个文件。以文件读取率指标为例,Storj 正式版的目标是达到 99.9999999% 的文件读取率。 Storj 表示目前网络有超过 4,800 个存储节点处于活跃状态,V3 版全新开始后,全球总存储量已经超过了 10PB。 若 Storj 在今年达到正式版,存储节点的数量将达到 5000 个,文件上传和下载的速度将会较亚马逊存储持平,具体各项指标可以查看官方博客文章: https://storj.io/blog/2019/11/measuring-production-readiness-using-qualification-gates/ 图片: https://uploader.shimo.im/f/l5e3XpAOsw9ilOg3.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo
Storj 更适合普通用户进行挖矿并参与,更适合整合闲置资源以扩大生态 Storj 用户可以通过提供存储空间收取租金,或租赁存储空间支付租金。绝大多数的小型设备,如 NAS、个人电脑、树莓派、都可以安装 Storj 节点,出租自己的闲置空间,适用于搭建一个极度分散化的云存储网络,适用于平民化挖矿。Storj 自诩为去中心处存储中的 Uber ,可以把社会闲置资源重新组织成可用的商业产品。 同时,Storj 官方推出了「Storj Labs 开源合作伙伴计划」,开源软件商如果有开发接入 Storj 的接口,并有用户通过它的开源软件使用了 Storj 服务的话,会得到 Storj 的收益分成。目前官方还未公布具体分成比例,但这一举措可以鼓励开源软件开发者,进而扩大 Storj 的应用生态。 我们分析项目的劣势: Storj 存储网络架构有一定意义上的中心化 目前 Storj 矿工薪资的发放是每个月第一周,由官方团队人工发放。同时,Storj 的网络结构里有一个负责协调存储用户和存储节点之间所有存储合约的第三方角色 ——可信 Satellite(卫星)。当然,需要特别说明,这种「Satellite」可不是天上飞的卫星,而是内容检索的服务集群,每一个 Satellite 相当于充当了 IPFS 网络里面的检索矿工的角色。 图片: https://uploader.shimo.im/f/LWdPrWSPW3ik8tdE.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo
由于 Storj 是开源的,未来人人都可以申请运行 Satellite, Satellite 可能会出现单点故障的风险,也就意味着如果单个 Satellite 故障,那通过该 Satellite 存储的所有数据将会无法访问。 目前 Storj 是通过把 Satellite 拆分成多个服务来解决该问题,虽然发生的概率较低,但不可避免的仍然有理论风险。同时,Storj 也将运行一组称为 Tardigrade Network 的特定可信 Satellite,旨在给客户的数据可用性和持久性提供一个保证服务水平协议 (SLA)。 Storj 的代币激励机制或影响项目初期的代币价格 Storj 支持用户使用信用卡或 Storj 代币支付存储服务帐单,而且会从收入中抽取 40% 做为团队薪资以及开源合作伙伴计划的支出,剩下的 60% 将会转换成 Storj 分配给矿工。当用户使用信用卡支付时,这 60% 的资金并不是从市场上买入 Storj 代币去发放给矿工,而是从团队的储备代币里面去换取 Storj 发放给矿工。 目前团队储备的 Storj 代币还有大概 2.8 亿个,只有当这 2.8 亿个代币转换完成后,才有可能直接从市场买入 Storj 代币去分发给矿工,这也决定了 Storj 的代币价格或将在一段时间内无法受到有效的激励。 运行 / 开发现状 目前 Storj 的产品路线图将在今年有重大进展,Storj 宣布将于今年一季度发布正式版产品,并公布了一系列可期待的新功能,包括: 将支持更多存储节点新平台,包括增加对 Qnap、Synology 和 Western Digital NAS 设备上运行节点的本地支持,以及对 FreeNAS 和 FreeBSD 的支持。针对开发者,Storj 增加了候补名单的名额,在开发者推荐计划中,活跃开发者可通过推荐其他开发者进驻该平台获得存储和带宽积分。从候补名单中激活的 Beta 帐户,将可免费获得每月 25GB 的存储和带宽,投入生产后,前 10,000 个开发者帐户将可获得 1TB 的信用额度,包括 30 天的存储和带宽价值。即将发布的新版本允许 NAS 运营商轻松地将未使用的 NAS 容量添加到网络中,并将支持将 NAS 硬件备份到 Tardigrade 存储中。
Arweave Arweave 是主打 一次性付费并获得永久文件存储的协议。Arweave 提供一种名为 Permaweb 永久网络的存储解决方案,利用区块链不可篡改的特性,直接把内容写入区块进行存储,以实现所谓的永久存储功能。 该项目利用访问证明(Proof of Access, POA) 激励矿工永远储存历史并根据要求分享,矿工在获得新的区块奖励的同时,同时也会因存储链中随机的旧区块而获得奖励,这意味着矿工存储的总块数越多,获得的收益就越多。 Arweave 的挖矿采用了 RadomX 的算法,同时在此基础上引入了区块完整率的参数。 由于 Arweave 的特性决定了其区块大小一定是随着网络的使用指数级上涨的,考虑到日益膨胀的区块数据,未来节点或有无法存储完整的区块数据的风险,因此,引入区块完整率的参数,不要求所有节点存储完整的区块数据,而且根据节点存储的区块数量多少来竞争区块打包。 我们分析项目的优势: Arweave 主打一次性付费并获得永久文件存储,补齐市场缺口 不同于 IPFS 主打去中心化存储、Storj 主打企业化存储服务,Arweave 主打永久存储,补齐了特定的市场需求,从根本来说,Arwaeve 解决的是如今互联网的言论自由受限、过度审查、易于篡改的问题。 具体应用来说,特别是在网络访问受限较多的地区,互联网用户无需下载新的浏览器,可以通过 Arweave 浏览器插件实现在区块链上永久存储网页、邮件、社交媒体发帖等数字文件和数据,完整真实地保留历史。 同时,Arweave 也可以帮助机构存储完整、不可篡改的知识及信息,比如用于存储气候变化数据库,目前 Arweave 与美国国家海洋与大气管理局合作将正在进行的二氧化碳测量值进行永久存储以测试 Permaweb。 Arweave 表示,将提供数据存储成本类似摩尔定律式的下降,用户只需要支付一次性的预付款 (每兆字节约半美分),而超额付款所产生的利息将帮助后续存储服务继续下降。Arweave 创始人 Sam Williams 表示,「近几年,Arweave 数据存储成本平均每年下降了 30%,只要该比率不低于 0.5%(按照如今的存储需求),去中心化网络仍然能够负担成本,如今的付款将将涵盖未来 200 年的存储空间的成本」。 我们分析项目的缺点: 实际应用场景较窄,不便于开发者使用 Arweave 特性能应用于以 HTML5 网页为主的数据保全,建立去中心化 H5-APP,但在实际使用中, 我们发行该存证的应用场景较窄,目前可以看到目前在 Arweave 上存储的最多的是推特的一些反政府言论的截图,明确的反政府应用增多是令人担忧的。 同时,Arweave 的特性是永不可篡改,这在程序开发上显得尤为困难,因为开发者上传到 Arweave 的程序必须任何错误都不能有,如果有错误,哪怕是一个标点,之前上传的内容都要作废,需要重新上传,势必造成大量无用垃圾堆积。另外,由于区块链的开放性,Arweave 上传的内容都是面向全社会开放的,不适合上传个人内容。 虽然该团队表示,Arweave 与 IPFS 兼容,在 IPFS 上构建的开发人员可以无缝过渡到 Arweave。但是开发者若是基于 Arweave 开发,会出现无法直接对自己的 HTML5 APP 进行升级的问题,开发者必须直接放弃旧的版本,重新上传新的版本,势必会出现一定的不便性。 商业模式较为简单,可能引发同质化项目的价格战 Arweave 主打主打一次性付费并获得永久文件存储,该模式较为简单,有一定风险会引发同质化项目出现利用相同的存储概念并打响价格战。 运行 / 开发现状 Arweave 项目于 2017 年创立,目前 Arweave 的主网已于 2018 年 6 月上线。 Arweave 表示,目前基于 Arweave 构建的永久性应用有 100 多个,包括通过转账将电子邮件内容写入区块的永久电子邮件存储客户端 Weavemail。 根据 Arweave 官方网站信息显示,目前全球有将近 300 多个节点, 最多为德国,有 223 个节点,美国有 150 多个节点,中国有 3 个节点。同时根据 Arweave 的转账数据显示,进入 2019 年 11 月以来,Arweave 的转账数量明显增多,但每日转账数量参差不齐,最低时每日仅有 1,000 多次转账,而在 2019 年圣诞节前后转账数量达到历史高峰 2,5125 次。
在融资方面,Arweave 此前曾获得 1kx 投资,并在 2018 年 6 月通过 ICO 融资 870 万美元。2019 年 11 月,Arweave 宣布完成 500 万美元融资,由加密资产投资机构 a16z 领投,联合广场风投(Union Square Ventures) 和 Multicoin Capital 参投。 Multicoin Capital 管理合伙人 Kyle Samani 在《Web3 堆栈全景》一文中提到,「不管底层数据位于何处,包括 Arweave 存储协议在内的链上中间件所提供的服务将充当开发人员的单一抽象层,此类服务将加快整个 Web3 生态系统的发展速度」。
4、生态中为数不多的万亿市场:去中心化存储 https://bicoin8.com/89502.html 去中心化存储的界定 首要咱们需求清晰,终究什么是去中心化存储,以及它与分布式存储又有什么区别。依照比较常见的理解,去中心化存储指的是在一个存储网络中,没有中心化组织作为存储体系的背书,而是相对独立的单个或部分集体奉献自己的存储空间作为该存储网络的组成单位,如此绕开了中心化组织存储带来的数据绝对操控权。 而分布式存储的概念则存在更久,依照更广义的说法,分布式存储体系是将数据分散存储在多台独立的设备上。分布式存储是指的架构上是分布式的,而去中心化存储则是指存储的内容是不受一个中心组织或单个所操控的。所以,去中心化存储必定是分布式存储,可是分布式存储纷歧定是去中心化存储。咱们常见的“云盘”便是分布式存储的一类,但其背面是有中心化组织所管控,它能够随时删减、修正咱们存在其间的数据,这与去中心化存储大相径庭。 因而,去中心化存储被认为是未来存储范畴更加广泛和落地一类存储方法,既能够增强存储数据的安全,乃至还能削减存储本钱。 去中心化存储与容量存储的项目有什么区别 当然,谈到去中心化存储,咱们不得不说到另一个简单被误解的东西,也便是最近大火的相似Chia这样的所谓去中心化存储项目,但本质上,Chia供给的并非真实意义上的去中心化存储,而仅仅是一种相似比特币相同的“容量证明”。 Chia本质上只是把存储空间的巨细(容量,Capacity)作为衡量网络参加者奉献的依据,这意味着存储空间越大取得的收益越多,而实际上并不能供给存储空间,用于咱们的生活和作业的需求,这与咱们期望的去中心化存储有较大区别。 回到真实的去中心化存储上来看,它应该是以供给存储空间(Storage)的服务质量来衡量对网络的奉献值,如此才算真实意义上的去中心化存储设备,而且才干有围绕着去中心化的存储空间诞生出许多优秀的去中心化运用,而下文说到的IPFS协议才算是当时阶段更契合去中心化存储开展的趋势。 去中心化存储中的重要协议——IPFS 在《Minecraft》被收买的同年,一个名为Protocol Labs(协议实验室)的组织加入了美国顶级孵化器Y-Combinator,随后该协议实验室于2015年1月向国际发布了IPFS(InterPlanetary File System),它是一个面向全球的、点对点的分布式版别文件体系,也被称为“星际文件体系”,经过该体系能够完成数据的点对点传输,存储的去中心化。 另一方面,IPFS的方针还想补充乃至是替代现在统治互联网的超文本传输协议(HTTP),以完成更安全、更安稳和更快速的网络传输。 而要成功构建去中心化存储的网络,除了有像IPFS这样的协议还不行,由于凭什么让其他人乐意供给存储空间到IPFS上呢? 这就需求在这个协议之上搭建一个鼓励层,为供给存储空间到IPFS的参加者供给加密钱银的鼓励,于是IPFS的团队协议实验室在学习了比特币的思路后,推出了Filecoin的区块链项目,作为IPFS的鼓励层。 当然,并不是说IPFS的鼓励层就只能是协议实验室做的Filecoin,由于IPFS是一个敞开的协议,其他团队也能够依据IPFS构建另一个鼓励层,究竟技能研发的路上没有仅有的正确答案。 相同的,“IPFS+鼓励层”的思路也并不是仅有的解决方案,咱们也看到了其他一些项目是经过自己构建协议并把区块链的token奖励机制集成在一起,以此搭建出另一个去中心化网络的思路,也由于他们的进入,让去中心化存储开展日益结实和深入人心。
比中心化贮存有更多的优势 1.1、内容存储去中心化,避免遭到中心化要素的危险 现在再翻开咱们十几年前常常阅读的网站,会发现他们之中的许多网站现已打不开了,显现404 not found,这是告诉咱们这个页面现已不存在了,究其原因,是由于咱们现在看到的网站内容,全都存储在一个中心化的服务器中,当网站的运营者不再付出服务器的本钱,这部分内容就会被服务器办理方删除,而网站的一切信息也都将永远的消失了。 像相似这种由于中心化存储的办理方删除了内容,又或许是被网盘删除了咱们存在云端的内容,等中心化的危险,将不再发生。IPFS允许内容以去中心化分布式的存储在不同的存储空间中,没有任何一个主体能够修正、删除存储的内容。 1.2、存储内容能够取得隐私维护 由于存储的文件会被拆分红很多份,再被加密的存放到不同的节点。因而,存储方并不能知道存储的内容是什么,能够有效地维护咱们的隐私,不会呈现之前的Facebook的5000万用户材料被走漏的状况。 1.3、更有效的进行备份,能够防止单点故障 由于存储的内容是分散到不同的当地,经过数据冗余的方法,能够有效地防止由于单点故障形成的数据丢失。传统的云存储尽管也能挑选备份多次,可是备份再多依然是受控于该云存储的公司,其安全性并不能跟着备份数量的添加而明显添加。 1.4、极大的节约现有的存储空间 IPFS有去重的功用,IPFS在存储文件时,会默许在全网备份三份(也能够自己挑选备份更多),之后相同的文件不会被再次存储到网络中。相比于咱们现在的存储状况,比方电影《阿凡达》,在2016年一年的下载次数就达到了1658万次,总下载数量更是惊人,有很多的空间被同一部电影所占据,而IPFS的去中心化存储能够极大地削减存储空间的占用,前进存储空间运用率。 1.5、本钱更低 相比于中心化的存储,会集中的占用很多的带宽,去中心化存储理论上能够下降一半以上的带宽消耗,下降网络本钱。而且去中心化存储在建造和运维层面也能够极大的下降本钱。 1.6、速度更快 由于网络能够首要挑选离用户更近的节点服务,而且天然支撑P2P加快等技能,使得读取数据的速度相较于传统存储更快
Web3.0的重要根底设备 Gavin所界说的Web3.0会是一个可扩展的一系列技能结构,并用一种全新的方法构建运用程序,经过这种新的运用,他期望每个人都能掌握自己的(数字)身份、财物和数据,进而掌握自己的命运。 要做到这一点,一个去中心化的网络是必不行少的,而这正是区块链技能在Web3.0中所担任的重要人物。可是关于现有的区块链来说并不能彻底满意Web3.0的需求,区块链本身也面对一些“存储瓶颈”。 现在的区块链存储的内容十分有限,并不能让一切的数据都去中心化。而且,在区块链存储十分有限的当下,其本身的账本也变得越来越大了, 而区块链技能本身是经过一切节点都存储相同的账本来达到不行篡改的,所以节点数越多,单个账本的存储空间也在变多,这会使得光是存储区块链的 账本就要消耗很多的存储资源。 所以,区块链+去中心化存储便成为了重要的解决方案。一方面,能够让区块链项目不再困扰于账本越来越大,将区块链的账本放在IPFS这类去中心化存储网络上,可极大地削减单个区块链项目的账本存储空间,让成为全节点变得越来越简单,也更利于区块链项目进一步去中心化。 另一方面,能够让更大的文件,比方图片,视频等也变得去中心化,这也十分契合当时火爆的NFT生态,NFT本便是属于个人的数字财物,但现在一些大的NFT财物,比方图片和视频,还做不到让其本身放到脸上,但假如结合了去中心化存储,便可让NFT不再受制于数据巨细和方法,这将给NFT带来更多的拓宽方向,也带来了区块链运用的更多或许。 跟着科技的开展,尤其是相似VR/AR等显现技能的提高,未来咱们乃至或许看到相似《头号玩家》那种场景:每个人都能经过一些VR/AR等智能设备进入一个虚拟的数字国际,在这个数字国际中,每个人都有属于自己的房子,数字钱银,数字财物等。咱们能够把存储空间看成是数字国际的土地,而构建于数字国际的各类运用便是土地之上的各种类型的建筑了。其间去中心化的属性是最重要的,由于你总不期望在数字国际里的房子是能够随时被别人窥探内部,或许随时或许被某个中心收回的吧。 所以,去中心化的存储便是承载这个数字国际的基石,也是Web3.0的重要根底设备。 5G引领的数据爆破年代的重要根底设备 跟着5G网络传输技能的前进,其他围绕着数据的技能,比方智能家居、物联网、VR/AR、智能汽车等也在乘上这班快车,并快速进化中。依据此,智能设备会遍布国际上的每个旮旯,万事万物都能够记录并搜集数据,能够预见在不久的几年后,咱们每天发生的数据会呈指数级添加。 据IDC猜测,全球数据圈的规模将由2018年的33ZB添加至2025年的175ZB,且文本、图片、视频等非结构化数据将具有更高的添加率,在全体数据圈的占比也将继续添加。 可是现有的中心化存储方法始终有瓶颈,正如咱们之前说到的,它并没有去重的功用,一份文件有或许在网络上存储成百上千份形成很多的糟蹋。尽管像亚马逊、阿里、腾讯等科技巨子现已纷繁声明将在未来几年斥巨资修建很多的数据中心,但数据爆破的扩展速度很或许会超过数据中心的建造速度,更重要的是,传统中心化的存储方法决议了它仍会糟蹋很多空间在 存储相同的内容上,所以不在根本上改变存储方法,是难以适应年代的开展的。 因而,去中心化存储必定会登上历史的重要舞台。而且,存储商场的扩容,也决议了这块蛋糕注定不能被巨子垄断,以去中心化存储的方法, 全民参加数字国际的建造必定是未来的趋势。
去中心化存储项目开展状况 去中心化存储作为区块链运用的重要场景,当时现已呈现了很多优质的项目。咱们以Filecoin、Storj、ARweave为例,简明扼要的论述当时去中心化存储项目的开展状况。 Filecoin Filecoin是IPFS背面的团队——协议实验室所做的IPFS的鼓励层区块链,IPFS本身作为协议现已能够正常运用了,可是假如没有鼓励,其他人凭什么会乐意将存储空间供给给IPFS呢?于是Filecoin便承担了鼓励的人物。 Filecoin的方针是构建一个依据IPFS的存储商场和检索商场,一起也是一个开源的云存储商场、协议和加密财物,是较早呈现而且一致最大的去中心化存储项目之一。 在Filecoin中,矿工是网络的重要参加者,与以往常见的挖矿不同,他们供给的不是核算才能,而是存储才能,切当的来说是依照所供给的有效存储空间为依据来判别参加者对整个网络的奉献值,并依据奉献的占比取得区块奖励。 当时Filecoin现已具有了足够的存储供给,达到了存储算力超过网络基线的根底方针,并开端了其加密经济鼓励机制向第二阶段的中期愿景跨进的新篇章。其鼓励方针从粗豪的容量建造转向建造与供需相匹配、全面可继续开展的容量。未来的Filecoin会向着更加高效的方向跨进。 而于此一起,有很多优秀的项目加入到Filecoin生态Showcase计划之中。涵盖了数据库、DeFi、中间件、买卖渠道、云教育、医疗等多个范畴,并与Wolfram Blockchain Labs、Chainlink等达到了合作。
Storj Storj Labs供给了端到端的加密和负担得起得分布式云存储,是一个去中心化依据区块链的分布式云存储体系。其底层根底是依据以太坊构建的。Storj运用其社区成员共享得备用磁盘驱动空间为开发人员、运营团队、公司和其他需求安全云存储的人员创立一个安全网络。其方针是成为抗检查、不会停机的去中心化云存储渠道。 Storj 网络包括三个主要组件 : 存储节点、卫星和上行链路。存储节点的作用是存储和返回数据的。上行线路(Uplink)是一种软件或服务,它能够把数据输入进去或直接从网络中获取数据。卫星(Satellite)的作用是作为上行线路和存储节点之间的一个中介,它能够促进存储交互,并决议哪个存储节点将存储哪些文件。 卫星与存储节点的关系是十分重要的。卫星担任向存储节点付出网络运用的存储和带宽费用。存储节点则期望为网络存储尽或许多的数据,这样它就能赚到最多的钱,而要完成这一点,在很大程度上需求依赖于卫星的帮忙。两者相当于生产方与途径方的相辅相成的作用。 当时Storj现已有2万个租户,1.8万个矿工和8PB的存储空间能够进行运用。能够接受BTC、ETH和Storj通证多种方法进行付出,而且与ETC Labs、zkSync等多个项目达到合作关系。其商用化云存储渠道Tardigrade已投入运用,正在为企业级用户供给去中心化数据存储服务。
ARweave Arweave则是另一种思路的IPFS鼓励层,它的方针是供给依据区块链技能的永久保存数据,是一个永久性的无服务器网络。Arweave认为数据存储本钱和摩尔定律相似,会逐步下降,所以用户只要将数据添加到区块链上时才需求付出存储费用。一起Arweave不会要求节点保存一切的区块数据以添加区块链的持久性。 Arweave挖矿的设备要求和家用电脑接近,只需求4核8GRAM和512G的硬盘就能够参加。矿工经过作为节点存储数据取得鼓励,保存的区块数量越多,越或许取得出块奖励,取得的出块奖励也越多。 当时Arweave网络中存储的数据达到了7.85TB,而且在全球有151个节点,平均日买卖量达到了26110笔。单日运用数据达到了888GB的历史高点,越来越受个人用户的青睐。 去中心化存储供给了一种安全、私密且价格低廉的去中心化存储方法。跟着越来越的人对去中心化存储的一致和需求的添加和监管的规范化,去中心化存储项目正在逐步成为干流。
波卡上的去中心化存储 有了干流的去中心化存储项目的思路,波卡生态上的去中心化存储项目又是怎样的状况呢? Filecoin转接桥 Filecoin其实也能够看做是波卡生态之一,Filecoin也一向与波卡有某些根由。 Filecoin的创始人Juan一向是Web3.0的忠诚信仰者,而其Filecoin和IPFS所做的去中心化存储也正好是Web3.0的重要组成部分。当波卡背面的Web3基金会举行Web3 Summit时,Juan作为Web3.0的布道者,自然成为了Web3 Summit的常客,在2018年和2019年都能见到他在大会上共享对Web3.0的见解。(假如不是2020年疫情的影响,咱们或许本能够再会到他参会) 而去中心化存储Filecoin+IPFS在Web3.0的奉献也取得了波卡创始人Gavin的认可。2019年12月,当波卡创始人Gavin Wood在一场推特上的AMA活动上,被问及:现在 Substrate 的贮存方法有哪些?我知道有 Substrate LFS 和 Substrate 中心概念的存储 。路线图是怎样计划的? Gavin表明:咱们正在研讨一种作为平行链的初始存储解决方案。不管咱们做什么,它都很或许集成到 IPFS 中。我也期望当 Filecoin 上线的时候能桥接到它。 因而,将Filecoin及其背面的IPFS作为波卡生态的一部分,是有据可依的。而从Gavin的表述来看,未来Filecoin很有或许取得一条公共利益平行链作为官方支撑的Filecoin转接桥。 当然,波卡生态并没有限定一条公链只允许有一个转接桥。以以太坊为例,除了官方支撑的SnowFork所做的以太坊转接桥,其他还有比方Plasm、Darwinia也都在做以太坊的转接桥。同理,Filecoin作为重要的生态,也有许多其他的波卡生态项目想要将Filecoin桥接到过去,并经过自己链接到波卡生态上。 2020年3月,波卡的生态项目ChainX透露正在开发Filecoin桥,ChainX作为财物跨链网关,其方针是将任何有价值的财物接入区块链网络,从而构建万链互联,价值自由传递的Web3.0生态。而Filecoin或许会成为一切区块链项目的根底设备,借助IPFS技能和Filecoin网络,能够解决存储方面的问题,这便是ChainX接入Filecoin的原因。
Crust Crust是去中心存储的鼓励层协议,包括了IPFS在内的多种存储层协议,并对运用层供给支撑。一起Crust的架构也有才能对去中心化核算层供给支撑,构建一个重视数据隐私和一切权的分布式生态。 与Filecoin不同的是,Crust并不是一条独自的公链,而是Polkadot的平行链。依据Substrate结构开发,一致算法、链下作业机、晋级机制等都和波卡生态保持一致,所以Crust链的成熟度反而比Filecoin更高。 由于Crust中心证明机制经过依据TEE的本地存储校验完成的,并不需求很多的算力,下降了对矿机装备的要求,一起矿工在Crust挖矿时不需求预先购买Token进行“前置抵押”。有许多家用办公等级的处理器就能够进行挖矿,挖矿门槛更低。 当时Crust推出了与主网功用相同的Crust Maxwell测试网,集成了代币质押、去中心化存储商场DSM及文件检索机制等中心功用。而且在社区得到了极好的反应。一起Crust推出了三大运用场景,分别为去中心化网络部署及运行、NFT数据存储、P2P内容存储及分发,与Uniswap、PolkaApps、Kaka、Coinversation等生态项目展开了合作。
对当下去中心化存储现状的总结和考虑 纵观当时干流的去中心化存储项目,咱们十分看好这个生态位的远景,可是依然有一些状况值得咱们考虑。 1.考虑 1.1、商业运用场景仍未得到大规模验证 尽管单个项目在探索商业化落地,可是间隔大规模的商业落地还遥遥无期,而像Filecoin这样的闻名去中心化存储项目,还停留在挖矿阶段,所以, 去中心化存储如何让传统所接受是一个值得探索的问题。 哪个项目能克服这个困难,就好比是Coinbase上市之后,能够直接获取到传统范畴的海量商场相同。 1.2、经济模型存疑 像Filecoin所要构建的存储商场和检索商场,其间是用其通证FIL作为付出的前言,那么这里就会有一个问题。流通的需求与币价的涨跌是相互按捺的。假如A是存储供给商,B是购买存储服务者,当B付出必定数量的FIL给A时,假如token涨了,A就赚了,可是对B来说就亏了,他就不那么情愿去付出;反之,假如token跌了,B就赚了,可是对A来说,收到的钱就少了,他就不那么乐意收款。所以,token的动摇会按捺贸易的进行,也就不利于FIL的存储商场和检索商场的活泼。 那么有没有什么方法呢?有的,假如用FIL铸造一个安稳币,做成安稳币+FIL的双币体系,安稳币用于存储商场和检索商场,而FIL作为承载整个Filecoin的开展盈利,便可一箭双雕,可是现在还未见到Filecoin有如此的规划,需求进一步调查。 1.3、存储的法律危险 由于去中心化存储自带隐私功用,关于维护咱们个人隐私很有协助,可是反过来看,假如是存储的内容是不法内容,去中心化存储不就成为了某些犯罪分子的温床了吗? 现在来看,我国关于去中心化存储还处在默许其开展的阶段,主要还是由于Filecoin还处在纯挖矿阶段,还没有到商业运用阶段,所以不确定之后Filecoin能够真实存储内容后,我国的方针是否会强监管。 别的有一点也需求留意,现在国内开端打压PoW类的挖矿行为,为了满意碳达峰和碳中和的方针,尽管没有清晰表明要严打存储类挖矿,可是像北京等单个城市是也在严打存储挖矿的,往后,方针危险会是国内去中心化存储挖矿的一个达摩克利斯之剑。而海外,也有观念在讨论去中心化存储上的不法数据带来的社会危险,所以,如安在监管与隐私,中心化与去中心化之间找到一个平衡点,是去中心化存储的一大难题。
2.启示 2.1、IPFS正在成为趋势 IPFS的网络效应正在逐步形成,就好像是现在的许多新式公链都会兼容以太坊的虚拟机EVM相同,许多做去中心化存储的项目也会兼容IPFS,由于现在IPFS在去中心化存储方面有最大的一致,开发者和运用也最多,兼容IPFS能够在开发上削减重复造轮子的麻烦,也能够直接链接到很多开发工具和开发者,十分有利于开展生态。 不仅是区块链项目,就连传统互联网巨子也在纷繁布局IPFS,早在2019年,微软旗下的Azure Marketplace就发布了IPFS(beta)产品,该产品能够创立IPFS节点的权限网络,以形成去中心化的存储网络。除此之外,全球榜首视频渠道Netflix(网飞)、谷歌、华为云、京东、火狐、Opera阅读器、Brave阅读器也都表明做了IPFS相关的部署。 如此看来,好像IPFS真的在朝着替代HTTP协议的方向前进,提早布局IPFS会是掌握去中心化存储盈利的一大思路。 2.2、这个赛道仍有很多机会 从存储的机制上来说,去中心化存储能够极大的削减存储空间的糟蹋,光是这一点来看,这个赛道便是存储方法不行或缺的一种转变,而除了Filecoin以外,咱们也见到有许多新奇的思路,像ARweave和Crust便是依据IPFS做了别的一种思路的鼓励层,所以,咱们彻底有理由相信会有更多的鼓励层思路推出。更何况,这其间还能够依据鼓励层的规划思路,去定位为存储的细分范畴,比方ARweave更倾向于永久存储一些贵重的信息(或许NFT)。亦或许,相似Storj做成商业化的运用。 2.3、传统存储巨子入场的竞赛 正如前面所述,IPFS也招引了很多传统互联网巨子的留意,这会带来一些变化,一是他们会结合本身的需求去探索半商业半去中心化的方法去开展存储相关业务,二是他们会像Paypal等传统付出巨子入局加密钱银相同,当IPFS的商业落地被探索清楚之后,他们入局所带来的用户和资金量或许会一举超过之前去中心化存储在加密钱银范畴的堆集。这会对现有的去中心化存储项目带来竞赛的压力,但危中有机,这一起也带来另一个契机,由于有更多的资金和用户关注到这块了,能否把流量和资金招引过来,到时就要各凭本事了。 不行否定的是咱们正站在通往Web3.0的年代入口前,在这样一个大年代面前,数据存储作为重中之重的赛道必然会遭到很多人的关注。当然,咱们既能够是年代的参加者也能够是生态的建造者,如此,方能一起享遭到Web3开展带来的盈利。
1、万字讲透去中心化存储 https://zhuanlan.zhihu.com/p/107707161 摘要 去中心化存储是一种通过分布式存储技术将文件或文件集分片存储在不同供应方提供的磁盘空间上的存储商业模式。它主张强隐私保护、低存储成本、数据冗余备份存储、高速等价值主张、开源的应用程序和算法,只有全部实现以上主张才可能大范围代替中心化存储。它有利于规避单点故障和数据的价值传递。 去中心化存储的架构自下而上依次为TCP/IP协议、区块链、去中心化存储协议和应用层。其中,TCP/IP协议对应Layer 0的网络层,包括网络拓扑结构以及交易的传播机制;区块链属于Layer 1,它自下而上分别为加密基础设施(一般为SHA-256等算法)、存储证明机制(共识机制);去中心化存储协议(服务层)包括存储协议(链上)、检索协议(链下)、身份协议(链上)、内容分发协议、激励协议等,包括Layer 1的激励分配机制和Layer 2的智能合约与脚本文件;最上层则是应用层,包括客户端软件和加速软件等。 去中心化存储与中心化存储在存储空间来源、带宽来源、安全性、使用方式、行业发展状态等多个维度存在差异,导致其规模和性能远远不如中心化存储系统。虽然IPFS等项目通过不同的“非中心化”设计方式弥补了其不同的缺陷,通过对上传方和存储节点给予代币激励的方式使全网存储总规模扩大,但是项目方与用户的利益不一致、费用结构的劣势等方面因素使去中心化存储的发展陷入瓶颈和停滞。本文结合实际情况,对去中心化存储实现其价值主张提供了参考建议。
正文 1 去中心化存储背景与价值主张 1.1. 去中心化存储产生的背景 WEB 3.0提倡“以数据为中心,数据价值化和隐私保护”,而去中心化存储在其中扮演着至关重要的角色,其中数据安全和隐私保护对应数据冗余存储和备份功能,而数据价值化对应的是文件共享的价值传递。数据安全方面,相比较于个人,企业往往更加重视公司数据的安全和隐私保护。企业存储在云端的数据往往是公司的机密,很多数据一旦被泄露很可能将公司在市场竞争上至于不利的地位,传统的公司资料实物存储方法对于大型企业来说早已不足以支撑海量数据存储的需求;数据价值共享方面,越来越多的人希望共享资源的同时获得相应的交换价值。比如人大经济论坛和喜马拉雅等平台在共享知识学习和文件的时候需要通过法币或积分的形式换取,而百度网盘和迅雷大多数则是以免费的形式进行价值传递,它们仅仅只是对下载速度等性能收取会员费,而共享内容的种子方并没有获得因共享文件而获得的价值。 近几年来,全球和国内云存储市场发展迅速,从GB级别到TB级别再上升到PB级别,文件存储的种类越来越多,文件的数据量也越来越大。 2012-2017年,全球云存储市场维持20%以上的高复合增速,而国内云存储市场的增速维持在85%-110%。根据多家机构的预测结果,预计2022年全球云存储市场规模将达到1000亿美元以上。 虽然云存储市场的规模和用户在飞速增长,但是中心化存储市场却具有四大缺陷:无法保障版权、无法保障数据安全、随时面临服务商停止运营的风险、数据缺乏价值化。 不论是由亚马逊等公司的第三方中心化存储,抑或者是公司本身存储用户的数据,从法律角度上用户对他们泄露数据信息不具有期待可能性。尤其是在数据为王的商业模式时代,精准数据将对各行各业的重构,控制数据来源或者以比竞争对手更低的成本获取数据的企业,其竞争实力将会显著高于其竞争对手。所以,竞争对手往往会想方设法的获取数据,而将用户数据泄露或出售的行为往往可以让数据存储服务商获得巨大的利益。 用户数据被收集后,中心化的存储使用户数据暴露在巨大的风险之下(泄露、黑客攻击等)。CSO 统计了自2000年以来最重大的 18 起用户数据泄露事件,尤其是最近两年,而且数据泄露量级也在呈指数级上升,不论是黑客攻击等外因,还是中心化存储方恶意的内因。例如,印度10亿公民身份数据库Aadhaar被曝遭受网络攻击事件、Facebook剑桥分析公司事件等。 由此,去中心化存储的商业模式就应运而生了。 去中心化存储基于区块链技术,通过非中心化的架构结合中心化与去中心化各自的优势在效益与公平之间探索平衡点,使存储的安全性提升;同时,通过区块链外存储和API接口的中心化处理,使得存储网络的TPS在现有公有链和联盟链的基础上得到大幅改善;并且,通过对种子节点或文件上传方实施激励措施,让其数据价值化。
1.2. 去中心化存储定义的内涵与外延 存储市场的商业组织形式可以分为中心化存储和去中心化存储。中心化存储是将数据完整的存储在中心化机构开发的服务器上,去中心化存储则是将数据切片分散存储在多个独立的存储供应商上。二者的技术实现方式通常会以分布式存储来体现。分布式存储是一种数据存储技术,它是将数据分散的存储于多台独立的机器设备上,通过纠删码(Erasure Encoding)技术实现数据的冗余存储。分布式网络存储系统采用可扩展的系统结构,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,解决了传统集中式存储系统中单存储服务器的瓶颈问题,并提高了系统的可靠性、可用性和扩展性。 需要注意的是,分布式存储仅仅是一种存储的技术方式,而中心化或去中心化存储是存储的商业模式。因为设备服务器与存储供应者是一对多的关系,即一个存储供应商可以控制多个存储节点,所以去中心化存储一定会使用分布式存储技术;但是,中心化存储可以使用分布式存储技术,也可以不使用分布式存储技术。
1.3. 去中心化存储的价值主张 去中心化存储代表着大规模存储的效率和经济的根本转变,它的价值主张主要体现在以下几个方面: (1)增强安全性和用户隐私。去中心化存储对数据的加密处理不仅仅局限于用户和软件终端,而且在存储网络所有环节上都在进行加密处理,并通过私有网络访问密钥、零知识证明等方法保护用户隐私。 (2)存储平台或网络的算法和代码必须是开源的。由于2C端的存储服务已经被中心化存储抢占了大多数市场,由于在开源项目初期进入门槛较高,大多数集中于2B端,只有代码开源才能让社区和应用的完善形成有效的正反馈效应。如果算法和代码不公开透明,则存储网络就会变相的中心化。 (3)通过冗余备份防止数据丢失。数据存储于不同的节点,通过数据冗余防止数据丢失(在数据存储或传输出错时存储额外的副本)。
2 去中心化存储系统的架构与运行 2.1. 去中心化存储的工作原理 在文件共享方式上,去中心化存储系统文件共享方式与中心化存储截然不同,中心化存储系统的大型文件上传后,文件以整体或切片的形式存储在单一或分布式的网络或服务器上,需要及其高效的开发、运营团队来维持其运转。 然而,去中心化存储必须使用分布式存储技术,初始种子节点(最初拥有完整文件资源的节点)在将大型文件进行切片处理后,使其产生多个Pieces,每个Piece分别存储在不同的节点上,每个一般节点在下载单个Piece并上传到去中心化存储网络中让其他节点下载后成为这个Piece的种子节点,在多个节点完成相互共享Piece的过程中,实现Piece在除初始种子节点之外的节点共享,并不断扩大该文件共享网络中的节点数。所以,在同一时刻其他条件不变时,随着下载人数的增多,下载同一内容的速度越快。因此,去中心化存储系统弥补了中心化存储系统传输速度慢的缺陷,同时克服了单点故障并保证了数据的安全性。
2.2. 去中心化存储的架构 去中心化存储架构自下而上有4个组成部分:网络协议(TCP/IP)、区块链或分布式账本、去中心化存储协议和应用程序。 其中,网络协议对应的是Layer 0;区块链或分布式账本对应的是Layer 1的底层加密和共识机制;去中心化存储协议对应的是Layer 1的激励机制设计和身份协议,以及Layer 2对接各类应用程序的智能合约、脚本语言和API接口等,直接对接各种服务应用,一般以API或者是智能合约的形式呈现;应用程序则对应的是Layer 2的应用层。 图片: https://uploader.shimo.im/f/8nkiFCFh56vwrKOQ.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo 2.2.1. 网络协议与网络层 网络协议包括TCP/IP的网络协议、存储网络和传播机制。网络拓扑结构的搭建和设计方式往往代表了该系统的价值目标的实现方式,决定了其传播机制和验证机制的运行效率。 存储网络的拓扑结构可以是P2P网络,也可以是存在几个联盟的中介服务商或运营商的去中心化网络(本文将此网络拓扑结构定义为非P2P网络),但不包括单一或寡头中心化存储服务商构建的基于多个服务器的分布式存储网络。 对于P2P网络,所有的节点都是对等节点(Peers),它们具有平等的权利和义务,去中心化程度是最高的,也是BitTorrent、IPFS和Storj等主流去中心化存储项目的网络结构模式,任何节点都可以通过租用和自身的磁盘等硬件为用户节点提供存储空间,也可以通过支付代币或免费的形式将数据分片存储到不同的对等节点上,交易的过程是可逆的,每个节点获得记账权的概率是均等的。对于非P2P去中心化存储网络,存在部分中介节点,服务器没有充分分散化和边缘化,类似联盟链(许可型区块链)的网络结构,交易信息的传播和沟通必须经过这些中介节点,中介节点与一般节点在权利与义务存在一定的不对等[2]。 传播机制方面,P2P网络传播延迟小于非P2P网络,并且更容易扩大规模[3]。假设对同一个内容存在一个非P2P共享存储网络(网络A)和一个P2P共享存储网络(网络B),A和B中均有100个节点,其中A存在20个中介节点,B存在100个对等节点。从主观能动性上来说,因为网络B更容易扩大规模,节点上传文件分片(Pieces)的动力强于A;从客观规律性来说,即便网络A和网络B的节点数拥有保持在相等的状态,由于存在网络A存在中介节点,仅有中介节点充当种子节点的角色,其他80个节点就会有搭便车(只下载资源不上传资源)的行为,完全起不到作用,从而导致网络传播延迟大于网络B。 验证机制方面,P2P网络的验证动力明显强于非P2P网络。P2P网络可以通过设置奖励代币的方式,激励大量的节点自发地去验证前面交易的真实性,寻找相应证据来佐证;而非P2P网络中,具有足够验证动机的节点仅有少数联盟的中介节点,其他节点因利益分配不均缺乏其他交易真实性的动力。显然,从发动51%攻击、女巫攻击或者镜像攻击的难易程度上,P2P网络显然比非P2P网络具有更高的难度。 2.2.2. 区块链或分布式账本 去中心化存储系统的区块链或分布式账本自下而上一般包括加密基础设施、交易记录、广播方式和存储证明机制。 对于加密基础设施,其加密方式一般是通过哈希函数加密,包括SHA-1、SHA-256等算法或配置表(Allocation Table)连接到默克尔根,在每个环节对数据加密处理后,再通过分布式哈希表(DHT, Distributed Hash Table)、追踪服务器(Tracker)等方式通过主键(Key——种子文件地址)检索到特定存储内容的共享网络。 对于存储证明机制(PoS, Proof-of-Storage),一般是在不通过下载内容的情况下,证明服务器在特定时刻已经存储了特定下载内容,及其数据的完整性,从而降低恶意节点的舞弊空间。它包括数据持有性证明(PDP, Provable Data Possession)和可恢复数据证明(PoR, Proof-of-Retrievability),但是不同项目针对不同的作恶动机和方式对该共识机制进行了完善。比如IPFS通过复制证明(PoRep, Proof-of-Replication)和时空证明(PoSt, Proof-of-Spacetime)两个方式分别遏制了女巫攻击、生成攻击和外源攻击。 对于交易记录,交易记录一般都是以抽象化的形式加密后记录在链上,交易记录的发生与记录必须在完成存储证明之后,将文件名称、时间戳、文件类别等信息组成区块头并存储在链上。
2.2.3. 去中心化存储协议 去中心化存储协议是整个系统的核心,包括存储协议、检索协议、激励机制和身份协议。其中激励机制和身份协议处于其下层,一般在Layer 1(链上);存储协议和检索协议则属于服务层,包含各类智能合约和脚本文件,从而决定了相关应用程序的设计,一般在Layer 2(链下)。由于去中心化存储项目的定位不同、进展阶段不同等多方面的因素,导致其去中心化存储协议在不同维度的设计上存在较大差异。 身份协议方面,分为存储用户的身份和节点身份。存储用户的身份一般以去中心化身份(DID, Decentralized Identity)的形成呈现,但是也有BitTorrent中心化身份的特例。用户仅仅只在提供最小化满足功能的个人信息的情况下,拥有对自己的身份及其相关数据的控制权、许可权和收益权;节点的身份一般在检索过程中,以哈希字符串的形式存储在链上,通过追踪服务器或哈希表可以有效查询某一特定文件或文件集的种子节点,一般表现形式为URL。 存储协议方面,协议指出用户节点以支付代币或免费的方式从种子节点下载其感兴趣的文件或文件集,而其对手方节点通过提供存储空间(购买或租用)或带宽资源来赚取代币或获得更高的获得记账权的概率,进而形成一个双向的智能合约或交易订单。首先,文件或文件集需要做切片处理,经过2.1节中的流程后,存储磁盘空间由该内容的共享网络(Swarm)中所有的节点提供相关的分片。存储协议中所有的步骤流程均在链上进行,包括订单的生成、共识机制的验证和价值传递等。 检索协议方面,去中心化存储的检索协议一般在链下执行,并由中心化机构进行开发、维护和运营,仅仅只有存在代币经济体系的情况下,其价值传递仍在链上进行,其记录抽象化加密后记录在区块链或分布式账本上。检索方式一般是通过节点身份(URL形式)对种子节点和共享网络进行检索,通过中心化检索服务器和DHT(分布式哈希表)的方式使下载者之间连接起来,进行资源检索。而DHT是对Tracker检索方式的改进,通过Key(通过检索内容的哈希函数生成的哈希字符串)对特定内容进行检索,并大大提升了检索效率。
2.2.4. 应用层 应用层一般包括存储客户端软件(包括存储功能和检索功能)、加速软件和用户代理程序等。通过SaaS(Software-as-a-Service,软件即服务)的方式实现盈利,应用软件及其相关基础设施在Layer 2(链下)。客户端软件一般与用户进行直接交互,它本质上是一个数据传感器,用来记录用户在存储网络中的行为,评估其转化率、活跃用户数(日活和月活)、搜索记录等,从而为项目未来的发展与经营提供有效参考。通过DID(去中心化身份)的模式让节点实现数据暴露最小化,使去中心化存储客户端仅仅在实现功能的基础上对用户的存储行为进行画像,而不反映存储和检索功能之外任何的数据信息。
3 去中心化存储与中心化存储的比较 3.1. 比较分析 图表8:中心化存储VS去中心化存储 图片: https://uploader.shimo.im/f/AOnL71L9UMCMqAxM.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo 数据来源:HashKey Hub
3.1.1. 存储空间和带宽来源的差异 中心化存储指由单一或寡头第三方机构利用自身搭建的服务器对外提供大规模数据存储服务的商业模式;去中心化存储指大量普通PC服务器通过Internet 互联,对外作为一个整体存储服务。 中心化存储的空间来源是由指定存储服务提供商开发和运营的存储云端,比如Amazon S3、阿里云和华为云的服务器等,下载的带宽由服务供应商提供;而去中心化存储空间来源是大量能够提供存储空间的PC、移动终端等设备,同一文件或文件集的共享网络中的所有节点都可以为其下载提供带宽。
3.1.2. 使用方式的差异 由于存储空间的来源不同,进而导致文件存储方式和检索方式截然不同。 存储方面,中心化存储由于存储空间是由中心化存储服务商开发并运营的,因此文件存储空间容量足够大,以至于可以存储海量数据,存储文件(不论是文本、语音还是视频等)整体存入云端,不需要对文件进行切片和去重的处理;去中心化存储由于存储供应者(服务商或个人)相对分散,存储空间也相对分散,需要相应的匹配优化算法在冗余的存储空间中寻找最优的存储空间提供者(即以最快的速度存储并合适的存储空间)。并且为了保证存储数据不会因单点攻击或故障、女巫攻击等外部性因素而丢失,去中心化存储系统在进行加密处理后将文件进行切片处理,并分散存储至不同的存储提供者的磁盘空间中。 内容检索方面,中心化存储以账户范式的形式对已存储数据进行访问,通过输入HTTP URL的方式连接到追踪服务器(Tracker),从而实现搜索特定存储内容;去中心化存储因为数据分散存储在不同的节点,所以需要通过DHT分布式哈希表将每个节点的链接用哈希函数生成哈希字符串,因此其下载速度随着下载的人数增多而加快。但是也造成了数据的大幅度冗余,很容易造成存储空间资源(如磁盘等)和带宽的浪费。
3.1.3. 安全性和隐私保护的差异 去中心化存储和中心化存储在安全性和隐私保护上具有各有优劣。去中心化存储的优势主要体现在以下两个方面: 一方面,去中心化存储规避了单点故障和部分节点断网或不可用等风险。由于去中心化存储的共享网络为P2P网络,而中心化存储的共享网络为以服务供应商为中心的中心化网络,从而导致前者不容易受到单点故障和服务器断网的影响,也不容易受到黑客的攻击。 另一方面,去中心化存储使用户的具体存储内容不因主观原因而泄露。去中心化存储通过零知识证明和非对称加密等技术,将哈希加密的字符串放在区块的最底层,连接到默克尔根,从而将存储内容的分片实现加密处理,其他任何节点包括运营商都无法看到存储的具体内容;而Amazon S3等中心化存储系统则通过账号范式,其具体内容服务商都可以看到,从而导致大规模云泄露和云安全事件频发,用户的隐私无法得到有效保障。 但是去中心化存储的劣势也很明显。采用非许可型区块链技术实现去中心化存储模式时,由于出块的全网广播和时间戳技术,导致所有参与节点都知道某一节点在某一特定时刻存储数据,随着节点之间的交互频率提升,全节点可以很容易查找交易发生的区块,从而暴露Hash值背后的身份,并用算法推测请求方或存储方的存储余额。再加上分散存储,每个片段如果都一般为64-512KB,一旦存储网络的大多数存储空间掌握在少数几个存储供应商手中,会比文件整本存储更容易被破解。
3.1.4. 存储费用结构的差异 由于中心化存储系统和去中心化存储系统的存储方式和检索方式的差异,导致二者在服务费用定价上存在差异。 中心化存储系统的收费标准是按月度、季度或年度为单位根据存储数据文件的大小收取存储费用,并且对存储费用实施一定的促销策略(免费试用期等)。比如Amazon S3收取存储费用为每月0.03美元/GB;阿里云针对个人和企业采用差异化定价的方式:个人收费为每月10元/GB,企业收费为每月2.5元/GB。 由于大多数去中心化存储网络平台处于项目运营初期,大部分产品处于开发阶段或MVP阶段,因此以低廉的存储费用来吸引用户流量。但是,相比较中心化的相对固定的服务费用,除了存储费用之外,去中心化存储还有检索费用、手续费和交易费。因此,去中心化存储仅仅适合冷数据存储,在检索数据量较少的情况下其费用比中心化存储低得多。而对于热数据,因检索频繁导致其成本可能高于中心化存储的费用。对于去中心化存储,因存储共享网络在扩大规模的同时必须伴随着检索热度的增加,而搜索热度的增加必然伴随着检索费用的上升,这在某种程度上是一个难题与挑战。
3.1.5. 可用性的差异 可用性方面,中心化存储在当前状态下具有显著优势。 一方面,中心化存储的文件存储形式采用整本上传,其数据完整性优于去中心化存储。一般来说,可用性的度量维度是客户端直接可用的文件(或文件集)的完整副本数。比如说对于种子节点,因其已上传完整的内容资源,所以其可用性为1,而对于去中心化存储分片后将不同的Piece存储在不同的节点,其共享网络中的单个节点的可用性通常小于1。 另一方面,中心化存储由一个或寡头的服务供应商运营并维护其共享网络的可持续性,特定共享内容网络的持续期较长。其HTTP URL的有效性在上传者不主动删除的情况下,链接将永久有效;而去中心化存储在存储内容可用性的可持续性上比较短暂,主要原因是缺乏有效的激励机制。
3.1.6. 存储文件大小与类型的差异 中心化存储在存储文件大小与类型没有任何限制,不论是视频、音频、文档都可以上传和存储,具有显著优势。 去中心化存储不同项目存在不同的适合存储的文件类型和大小,比如Storj定义小文件是1MB以下的而大文件是4MB以上的。显然文件越大切片的难度也就越高,有些去中心化存储网络只能存储文本文档和图像,有些则可以存储视频和音频,导致市场相对分散。 去中心化存储可减轻数据故障和中断的风险,同时提高对象存储的安全性和私密性。它还使市场力量能够以比任何一家单一提供商都无法承受的更高价格优化价格更低廉的存储。尽管有很多方法可以构建这样的系统,但是任何给定的实现都应该解决一些特定的责任。基于我们在PB级存储系统方面的经验,我们引入了一个模块化框架来考虑这些责任并构建我们的分布式存储网络。 另外,我们描述了整个框架的初始具体实现。而对于大型文件(一般大于1GB),在通过哈希加密产生的字符串太多,以至于用户无法记住其哈希字符串,从而导致去中心化存储对用户的接受性减弱。
3.1.7. 下载速度评估方式的差异 去中心化存储和中心化存储在对下载速度评估上存在显著差异。 中心化存储通过中心化的服务器为用户提供带宽进行下载,只要缴纳会员费或者提升会员等级就可以显著提升下载速度,比如用户在使用百度网盘时,在没有会员的情况下下载速度仅为200KB/s,而在成为会员的情况下下载速度高达2-5MB/s,而且还会有限速措施;去中心化存储的下载速度取决于其贡献程度,即该节点当前上传内容分片的数量,在其他条件不变的情况下,种子节点的数量越多,下载的人数越多,上传的内容越多,其下载速度越快。同时,对“只下载,不上传”的搭便车节点以限速的形式进行适当的惩罚[5]。
3.1.8. 发展程度的差异 中心化存储市场占主导,处于成熟期;去中心化存储仍然处于初创期,技术架构和体系尚未成熟。 从行业周期理论角度出发,行业的发展阶段分为初创期、成长期、成熟期和衰退期。存储市场总收入规模达到了130亿美元以上,中心化存储2019年上半年目前已经形成了寡头垄断的竞争格局,以Dell Technology、H3C、IBM、联想、华为等巨头为主,并且前10家中心化存储公司的市场份额达到62.9%。 而Sia、BitTorrent、IPFS等去中心化存储项目部分仍在开发阶段,而且进度较为缓慢,而开发完成的Sia和Storj的存储空间总量仅为2PB,而实际使用空间仅为全网总存储空间的40%不到,与中心化存储的收入相去甚远。
3.2. 去中心化存储的挑战 相比较于中心化存储,去中心化存储虽然在隐私保护和安全性上具有一定的优势,但是在技术、治理、激励机制等方面仍存在诸多不足,比如对于大型文件的用户体验减弱、费用不稳定、激励机制设计上存在规模与效益的矛盾等。因此,未来去中心化存储市场需要引入稳定的费用定价、建立恰当的激励机制等方式来逐步完善,在保持安全性的优势基础上,实现规模与性能的兼顾。 接下来将简析现有的去中心化存储项目,并对其优缺点进行相应评价。
4 去中心化存储项目简析 4.1. 代表性项目 目前,已经部署的去中心化存储项目无法从单一的维度进行分类,每个项目都有各自的特点,只能在大致上进行初步划分。 按功能实现的模式划分,以BitTorrent、IPFS和Lambda为代表的项目更加偏向于基于内容寻址的文件共享网络,而以Sia、Storj、MaidSafe为代表的项目则更加偏向于提供电子网盘。 BitTorrent是最早的去中心化存储项目,但是因其大部分缺乏激励机制,只有少部分引入了TRON网络的BTT经济,所以作为去中心化存储模式的雏形;IPFS则是去中心化项目中融资额度最大的,累积融资额高达2.57亿美元,通过出块奖励、手续费和服务费等方式激励点对点存储,并通过优化的Kademelia算法匹配存储的供应和需求;Lambda在IPFS的基础上引入了TBB经济,通过质押TBB代币变相地降低了存储矿工的进入壁垒;Storj和Sia更倾向于提供电子网盘,不要求实际存储,只要提供足够的存储空间就可以挖矿;Sia则是通过内置智能合约的方式为P2P存储网络中不同的节点提供协商和沟通的空间。 图表10:代表性去中心化存储项目比较 图片: https://uploader.shimo.im/f/TDi3xa3V2KfaaQpc.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo 数据来源:HashKey Hub 4.2. BitTorrent——去中心化存储项目的雏形 (1)项目介绍 BitTorrent简称BT,是一种开源的内容分发协议,由布拉姆科恩于2003年自主开发[6]。它采用高效的软件分发系统和点对点技术共享大体积文件(如一部电影或电视节目),并使每个用户像网络重新分配结点那样提供上传服务。常用的应用软件包括BitTorrent、μTorrent等。 (2)工作原理 BitTorrent的工作原理与一般的去中心化存储协议无差异,如上文2.1节阐述,将文件进行切片处理,再将每个Piece分割成多个大小为64-512KB的块,每块生成一个哈希字符串,然后利用SHA-1算法加密后分发给该文件或文件集的共享网络(Swarm)中的各个节点。具有完整文件的对等节点为种子节点,其他为非种子节点。然后,共享网络中的所有节点相互传输文件资源,让更多的节点变成种子节点,并且通过Opitimistic Unchoked算法选出2个共享网络外的节点,以扩大共享网络。 (3)项目架构 图表11:BitTorrent自下而上的架构图 图片: https://uploader.shimo.im/f/GMgYTJ2AjmVfsMSd.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo 数据来源:HashKey Hub
BitTorrent的架构采用“P2P+中心化”的双层模式进行布置,其中存储共享网络采用P2P的模式,而检索协议采用中心化检索模式,其索引文件后缀为”.torrent”。 检索方面,正如本文2.2.3节所述,BitTorrent检索中以加密后的链接为节点的身份,采用哈希分布表对接追踪服务器的模式对特定存储文件或文件集进行有效检索。其中,Torrent文件包括Announce和info两个部分组成, Announce为检索所需的URL,其数据类型为字符串;info是一个字典型的数据,其索引包括Name(内容名称)、Piece Length(每个切片的字节大小, 除了最后一片,其他等分)、Pieces(利用SHA-1哈希加密后的每个Piece,以便于通过hash验证)、length or files(内容是单一文件还是文件集)。 存储方面,通过对特定Torrent文件切片后分散存储在不同节点上,在此之前必须通过Tit-for-Tat(TFT)的激励机制来筛选该内容共享网络中的节点。BitTorrent将该内容共享网络中的所有节点分为阻塞节点(Choked)和非阻塞节点(Unchoked),只有非阻塞节点拥有足够的速度或带宽下载或上传该内容,而阻塞节点则无法传输内容。通过以下三种情况将被判定为阻塞节点: (a)贡献过少或搭便车过多(只下载不上传)而因此被列入黑名单的节点; (b)接受节点本身就是种子节点; (C)存储空间已经满负荷的节点。 在TFT(Tit-for-Tat)算法配合的激励机制下,一方面根据以上判定方法在该内容的共享网络中确认阻塞节点,共享网络中的其他节点为非阻塞节点,再随机抽样出2个共享网络外的节点作为乐观非阻塞节点(Optimistic Unchoking)。一方面,遏制了该共享网络内节点搭便车(Leech)行为;另一方面,有利于共享网络的扩大。 (4)项目评价 BitTorrent项目作为最早的分布式存储项目,在激励机制和共享网络上的设计上是比较成功的,并通过免费的模式让其普遍受到用户的青睐,并且通过P2P网络实现了下载人数越多速度越快的目标。 但BitTorrent仍存在一定的改进空间。首先,BitTorrent只能将该激励机制局限在同一内容的共享网络范围之内,而对用户下载后保持内容的可用性方面缺乏有效的激励手段;其次,因BitTorrent的协议开源导致盗版猖獗,甚至通过该网络传播暴力、色情等不良内容,从而导致部分重视知识版权的国家(如法国等)全面禁止使用BitTorrent;再者,BitTorrent对贡献带宽高的节点不公平,在其他条件不变时,节点贡献的带宽越高,TFT算法的时延越长,下载速度的边际增长越低[7]。
图表12:下载速度随着带宽的提升而边际递减 图片: https://uploader.shimo.im/f/K92y3p5eoXV0wI8D.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo 数据来源:http://bittorrent.org/bittorrentecon.pdf
4.3. IPFS——融资额度最高的项目 (1)项目介绍 IPFS本质上是一个底层的开源文件传输协议,旨在对基于HTTP URL检索协议进行补充甚至替代,其代币为Filecoin。虽然Filecoin目前尚未正式在交易所上市或者发行,但是Filecoin期货早在2017年8月上线。Filecoin在上线之初就获得超过2.5亿美元的融资,其融资额远超其他去中心化存储项目,目前项目处于开发阶段,Protocol Labs目前对Filecoin激励机制和经济模型的仍在处于开发阶段。 (2)项目架构 图表13:自下而上的IPFS架构 图片: https://uploader.shimo.im/f/wSiO618zALGPXz4g.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo 数据来源:HashKey Hub
架构最底层为Libp2p,包括路由层(网络协议)和交换层(P2P网络),确保数据能够在点对点网络上实现点对点的传输。 上一层为Multiformat,用于加密数据并将数据抽象成放在链上的格式,它本质上是一个针对未来系统的协议集合,通过增强的自我描述格式(包括自我描述的哈希值、网络地址、编码值、序列化值、网络传输流和分组网络协议来实现互操作性并避免被锁定。 再上一层是Filecoin协议作为激励层,该协议包括链上存储市场、链下检索市场和Filecoin区块链三部分[4]。存储市场方面,矿工通过抵押Filecoin租用或购买存储空间,接着用户向其发起定向存储请求,并生成bid(用户)和ask(矿工)双向订单,并进行PoRep(复制证明)和PoSt(时空证明),最后用户获得有效存储(完成两种共识后的存储大小),矿工获得存储费用,注意不论是订单、交易记录还是Filecoin的价值转移全部在链上完成。检索市场方面,用户先发起检索请求,接着矿工获得检索订单并提供检索服务,最后用户通过支付Filecoin获得服务,注意仅有Filecoin的价值转移被记录到链下,其他均在链下完成。Filecoin区块链方面,分为订单簿(Orderbook)、交易记录(Transactions)、配置表(Allocation Table)。其中最底层的配置表通过连接到默克尔根对链上信息加密,用于存放双方的数字签名,对矿工发起质询并接受其回复;交易记录用来实现Filecoin的价值转移功能;订单簿用来记录存储订单。 图表14:自下而上的Filecoin架构 图片: https://uploader.shimo.im/f/STIQu91K8cFF6m5t.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo 数据来源:《Filecoin白皮书》 IPLD包括命名层、对象层和文件层,用于定义和查找数据,从而实现文件从命名到编程再到检索的过程。对于命名层,IPFS通过IPNS使在文件名变更的情况下锁定到其最新状态,它采用自我认证证明的方式,给每个用户分配一个可变的命名空间(路径为/ipns/),用户可以在此路径下发布一个用自己私钥签名的对象,当其他用户获取对象时可以检测签名与公钥和节点ID(IPFS之前生成的链接)是否匹配;对于对象层,IPFS使用Merkle DAG技术,构建了一个有向无环图数据结构,用于存储对象数据,通常由Base58编码的散列引用,该数据结构具有内容可寻址、防篡改、重复数据删除的特点;对于文件层,将大于256KB的数据文件分割成多个块(每块256KB),每块的数据类型为blob对象,list对象由几个blob对象组成(可能重复),而Tree则是一个json格式的从名字到哈希值的映射表,由于Tree比blob小从而便于通过DHT进行检索。 (3)项目评价 IPFS在治理上采用了PoRep和PoSt的证明有效遏制了女巫攻击、生成攻击和外源攻击等投机行为,并且通过强制购买GPU矿机使PoSt可以在每隔45s可以证明“任意节点是否在该特定时刻已经存储了某一特定大小的文件”,通过默克尔树让每个文件分片(Piece)保留一个根哈希值,大大减少了数据冗余。但是因项目处于初步公测阶段,仍有以下几点值得探讨: (a)IPFS的市场非常小众,仅仅是对私存储(因为容量有限),并且由于GPU矿机的挖矿成本较高,家庭户无法直接参与到存储挖矿,只能参与检索过程并赚取服务费,仅仅只是对大型规模的矿池或者合伙存储供应商具有较大吸引力,从而不利于全网总存储集中于少数存储供应商或矿池分散化,容易陷入Filecoin供过于求的困境; (b)如果数据量较大(超过1TB),用户必须记住和保留多个根Hash值,从而不利于用户体验,如何控制少数家庭用户的流失率将会成为IPFS发展的挑战; (c)与BitTorrent相比,即便IPFS初期存储免费,检索费用根据数据热度决定,不提供永久的存储,仅仅只是租用存储空间,高额的存储费用和检索费用以及高投入(GPU矿机)导致用户门槛巨高; (d)IPFS网络没有特定服务器的P2P节点,效率有待于进一步加强; (e)无法充分遏制存储矿工上传大量垃圾数据作为有效存储的行为; (f)PoRep共识机制决定了无法进行全网校验,付费存储的方式才可以进行挖矿,如果规模扩大,由于Filecoin的出块率等于挖矿节点的有效存储除以全网总存储量,挖矿难度将会大增,无法赚取收益,容易陷入价格战。
4.4. Lambda——基于IPFS的延伸 (1)项目介绍 Lambda是一个区块链数据存储的基础设施,通过对Lambda Chain和Lambda DB的逻辑解耦和分别实现,通过Dapp提供可无限扩展的数据存储能力,并实现了多链数据协同存储、跨链数据管理、数据隐私保护、数据持有性证明、分布式智能计算等服务。 (2)项目架构 Lambda包括Lambda Chain(同构多链的链系统)、Lambda DB(同构多链的链系统)、Lambda Agent(提供内存数据存储、性能监控、安全监控和Metrics数据上传能力的探针系统)、Lambda P2P(提供数据检索功能)[8]。Lambda采用链库分离的架构设计的原因有二: (a)因为区块链系统更新导致分叉,所以将主要数据处理能力放在数据库(Lambda DB)上; (b)通过功能子链保证其可扩展性,从而实现隐私保护(基于多授权机构属性加密)和数据持有证明(PDP, Provable Data Possession)。
图表15:链库分离的Lambda架构 图片: https://uploader.shimo.im/f/5X22SQetgMordxXE.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo 数据来源:《Lambda白皮书》
(3)经济设计 Lambda项目采用LAMB和TBB双层代币的方式分别对存储挖矿和质押存储实施激励和惩罚手段。其中,LAMB是原生代币,用于区块奖励发放,流通、支付交易手续费和生态应用费用结算;TBB则是存储网络的存储空间资产,主要作用是质押和锚定存储资产权益。 Lambda网络中主要角色有5个:存储矿工(提供存储空间)、验证节点(负责运营和维护共识网络)、存储资产做市商(为存储矿工提供存储资源流通性)、合伙人节点(负责生态建设,不参与存储网络)、出块节点(由验证节点结合质押容量量按照权重选出,负责区块数据的打包以及共识的发起)[9]。 出块奖励有2种:对于存储挖矿方面,43%的出块奖励给矿工及其验证节点;对于质押挖矿方面,50%的出块奖励给矿工及其验证节点。二者的区块打包收益则根据该验证节点收集投票的多少决定打包区块收益(出块总奖励的1%-5%),社区收益占总收益的2%,验证人可以自定义佣金费率。 当验证节点对区块进行双签、对近10000个块中少于500个签名、质押少于666.66TBB时会受到“扣除质押TBB和提出验证节点候选人”的惩罚。 (4)项目评价 Lambda通过非中心化的方式,在存储做市商和数据库上以中心化的形式部署,大大提高了全网的数据吞吐量,使网络未来的可扩展性大大增强。它本质上是IPFS项目的延伸与扩展,并且通过引入TBB抵押存储机制降低了使用门槛,但是仍然不利于家庭用户参与到存储挖矿。 但是,Lambda仍有值得商榷的地方。比如Lambda通过NPoS(Nominated Proof-of-Stake)和PDP(Provable Data Possession)的存储证明机制无法证明存储矿工恶意存储大量垃圾数据从而提升其打包概率赚取LAMB的行为,一旦验证节点候选人被“黑化”,甚至全网总存储份额无法得到充分稀释,使51%攻击的难度较低,大多数挖矿的收益集中于少数人手上,从而导致用户的存储需求和质押需求大幅下降,从而导致LAMB逐渐供过于求,导致LAMB兑美元大幅下跌和贬值。
4.5. Storj ——基于ETH网络的分布式存储协议 (1)项目介绍 Storj 是一个基于以太坊的分布式云存储协议,由盈利性公司Stroj Labs开发,旨在利用未使用的硬盘和带宽,让P2P网络上任何节点之间都可以进行磋商、数据传输、验证数据完整性和可用性、检索数据、价值传递,存储节点通过提供存储空间收取租金,而其对手方承租磁盘空间支付租金。当前,Storj全球总存储量已经超过了150PB,存储费用为每月0.015美元/GB,下载1GB所需的带宽费用为0.05美元。 (2)Storj协议架构 Storj协议包括文件切片处理、Storj网络、PoR证明机制、支付协议、广播协议。对于同一内容的共享网络,节点分为存储节点、卫星节点和上连节点[10]。 存储节点方面,通过出租磁盘和提供带宽而赚取Storj代币,如果没有通过随机审查,则该节点会从存储节点池中剔除,它们不为存储数据的初始传输(带宽入口)付费,不为节点发现支付任何费用,有效遏制了存储节点为了更多存储空间而删除原有存储数据的行为(延长内容共享网络的可用性的持续期)。存储节点将允许管理员在最近30天内配置最大的磁盘空间和每个卫星的带宽使用量,在跟踪以上2个指标后拒绝没有有效签名的操作。 文件切片和加密方面,对于特定文件集Bucket,每个文件可以根据特定路径进行检索。对每个文件,首先将其切分成多个Segments(分片大小由用户自定义),若某个Segment小于其元数据的大小,则节省了存储空间,该Segment被称为内联Segment。在通过AES256-CTR算法加密后,将加密后的哈希字符串拆分成多个Stripe,每个Stripe执行纠删码编码(通过调整原数据块和校验数据块的比例来提升网络节点的容错能力,使数据安全性提升),将相同索引的纠删码片段拼接组成一个Piece。最后,将每个Piece分发给共享网络中不同的节点,并通过指针实现对不同文件片段的检索。 Storj网络方面,为了使承租节点和存储节点进行磋商和交互,Storj将合约和磋商系统建立在Kademlia分布式哈希表上,以实现传递所需的确认信息最小化。通过增强核心Kademlia功能,传递Ping(确认节点是否在线)、STORE(在DHT上存入哈希值)、FIND_NODE(寻找DHT上有存储空间的节点)、FIND_VALUE(寻找DHT上的哈希值)四种信息,促进不同节点的交流。首先,如果某个节点要加入某个文件的共享网络,必须先创建一个公钥私钥对,Kademlia节点的ID必须与通过SHA-256加密后的公钥哈希字符串一致,因此每个节点的ID也是一个有效的比特币地址,在发送信息前必须通过数字签名对信息进行验证。 共识机制方面,Storj通过“质疑-回复”的形式来实现PoR(检索证明),确保远程主机确实存储了特定文件分片,并验证文件的完整性和可用性。Storj采用默克尔根和默克尔树的深度两个指标,通过验证其叶子集合的元素个数是否与默克尔树的深度相等,并且提供的哈希值会重新创建存储的根。通过执行简单的Tit-for-Tat模式,如果存储节点未通过审核或无法证明自己仍然有数据,那么承租节点就不必付款;如果租户下线或未能按时付款,则存储节点可以删除数据,并从其他人那里寻找新合同。 图表16:Storj文件存储工作原理 图片: https://uploader.shimo.im/f/TT9sZArncm8oHL9e.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo 数据来源:《Storj白皮书》
图表17:Stroj节点分类 图片: https://uploader.shimo.im/f/jtFsJrQBH73YWfb6.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo 数据来源:HashKey Hub
(3)项目评价 Storj在技术上通过Bridge客户端实现了对Amazon S3等其他存储格式的兼容,并且通过以美元计价的标准避免了存储费用的大幅波动,其存储费用远远低于中心化存储平台,并且通过Kademlia算法优化了检索模式,大大减少了数据的冗余和资源浪费。 但是有些地方仍值得商榷。首先,由于Storjcoin的波动率较高,从而导致存储节点获得的出块奖励大幅波动,从而无法在长期上保证更多的用户提供更多的存储空间。其次,由于缺乏有效措施延长文件可用性维持的时间,这将不利于共享网络的扩大。再者,随着Filecoin加入市场,Storj不具备显著的竞争优势和资金优势。更重要的是,Storj本质上只是完成存储资源的对接,缺乏有效的内容寻址方法,不利于文件共享(如电影、音频等),只是适用于大规模数据的存储(如监测数据、交易数据等)。
4.6. Sia——BTC在去中心化存储的变体应用 (1)项目介绍 Sia是一个分布式云存储协议,由Nebulous公司负责开发与运营,倾向于在P2P和2B端与现有存储解决方案进行竞争。Sia支持存储网络的对等节点之间形成合约,为下载特定存储内容定价,旨在让承租节点以更便宜、更快捷的方式租赁到合适的存储空间,通过Siacoin经济设计促进承租节点和出租节点双方达成一致。目前,Sia的存储空间总容量仅为2PB,已存储的空间仅为206TB,而存储节点为333个,累计下载总量仅为1.2MB。 (2)项目架构 交易结构方面,Sia交易包括协议版本号、Arbitrary Data(任意数据字段,以便于数据的检索)、矿工奖励、Inputs(收入资金)、Outputs(支出资金)、文件合约、存储证明、数字签名(所有输入都应当进行数字签名)[11]。Sia通过在所有交易中使用M-N多重签名方案,完全避开了脚本系统,减少了复杂性和攻击可能性。每个区块头的输入必须来自上一个区块头的输出,因此该区块的输入必须是上一个区块头的输出的哈希值,输出包含其Merkle根;Siacoin的支出条件是“时间锁定已经超且足够的指定公钥添加了它们的签名”,签名的数量、公钥组和时间锁定写入Merkle树的叶子节点,而该树的默克尔根作为Siacoin发送的地址,交易双方可以自主选择披露公钥的数量和签名的数量。 文件合约方面,文件合约是存储节点和其客户之间的存储协议,文件被分片成多个散列在哈希加密后,生成其默克尔根(合约的核心),根散列以及文件的总大小可用于验证存储证据。合约进一步规定持续时间、挑战频率和支付参数(有效证明的奖励、无效或缺少证据的奖励以及可以错过的最大证明数量)。其中挑战频率规定提交存储证明的次数,在挑战期间提交一份有效证明将触发转账交易;若没有在持续期内提供有效证明,合约将会发送到“错过证明”地址(有效防止DDOS攻击)。支付参数中“可以错过的最大证明数量”为1个阈值,如果错过证明数量超过该阈值,合同无效。 存储证明方面,存储证明仅需要合约的身份(哈希值)和证明数据。首先,通过原文件分片存储在默克尔树的叶子节点,生成的哈希根将与之前预先生成的根哈希进行对比,若二者相同,则可证明这些分片确实来源于原文件。Sia通过让客户端指定很高的挑战频率,并对丢失的证据进行大量处罚,从而阻止低于全网总算力50%以下的任何攻击,并遏制私自挖矿的行为。另一方面,由于用户节点有权拒绝任何交易,所以当恶意矿工人为以“是否将存储证明上链”为名来勒索高额交易费时,用户可以直接终止交易。 (3)项目评价 Sia协议本质上是BTC在去中心化存储的一个变体应用,但是其机制设计有些地方仍值得商榷。在Siacoin经济方面,Siacoin的发行数量是递增的,但是其增长率是递减的(初始区块产生30万个Siacoin,之后每产生一个区块减少1个Siacoin,直到减少到30000个区块,平均每10分钟产生1个区块),从而导致随着Siacoin数量的增加而带来较大幅度的贬值,从而导致其存储费用波动较大。对于挖矿体系来说,随着Siacoin的贬值与滥发,导致算力较强的矿工会产生不成比例的优势,最终挖矿人数将会大幅下降,不利于调动矿工参与的积极性。因此,Sia不论是从存储规模上还是交易效率上都远远低于Storj,更不用说和BitTorrent相比。
5 去中心化存储未来展望 5.1. 去中心化存储的发展陷入瓶颈或停滞 从严格意义上,去中心化存储并非真正意义上的去中心化,而是非中心化,比如Filecoin在存储方面是去中心化的,而在检索方面是中心化的。尽管中心化存储在隐私保护、收费标准、数据安全性方面存在诸多不足,但是去中心化存储由于法律因素以及经济设计等诸多问题,从而导致大多数去中心化存储平台的客户仍然十分小众,提供的存储空间远远小于中心化存储网络,难以满足数据大规模存储和检索的要求,与1.3节中提到的去中心化存储的价值主张发生严重背离。 以下两点主要原因导致去中心化存储网络难以做大: (1)存储成本不稳定,费用结构不合理 一方面,去中心化存储网络的存储成本存在较大波动性。比如Sia、MaidSafe和Lambda等项目因其代币波动较大,而且代币发行机制设计不合理,容易导致代币超发,从而导致其代币价格长期呈下跌趋势,进而导致存储费用和检索费用不稳定,从而导致用户流失率较高。另一方面,数据检索不是免费的,从而使费用结构不合理。尽管去中心化存储网络的存储费用远远低于中心化存储,比如Storj的存储费用仅为每月0.015美元/GB,远远低于Amazon的每月2.5美元/GB,但是如果考虑检索费用或者对数据检索和调用频率的话,那么去中心化存储费用很可能高于中心化存储的成本。 (2)利益多方冲突导致项目方的短期行为严重 为了克服传统非许可型区块链(如BTC、ETH和EOS)等可扩展性不足的缺陷,相当一部分去中心化存储项目采用非中心化的方式,比如Lambda在存储资产做市商的中介化与链下的Lambda DB和Filecoin检索协议的链下处理。但是,项目方和用户的利益在诸多情况下存在不一致,从而导致项目方的短期行为。存储网络规模的扩大和交易公平性往往是存在矛盾的,例如Filecoin的项目方为了短期扩大全网存储规模而基于有效存储占全网总存储的比例设计挖矿成功的概率,导致用户存储和挖矿的动力减弱,具有高存储空间的节点可以获得比线性增量更高的回报和收益,而项目方本身可能就会扮演具有高存储空间的角色,使去中心化存储项目的价值观出现扭曲。 (3)代币发行通胀率设计陷入两难 去中心化存储网络的商业目标是吸引更多的用户提供更多的存储空间,并且将存储空间的利用率最大化,而实现此目标的前提是保证代币的高流动性并且不让其币值稳定,但是这往往是矛盾的。如果代币发行的通胀率偏低,在未来一定时期内代币的发行量是递减的,很容易造成代币走向升值趋势,存储网络参与者倾向于囤积代币以实现资产增值,从而不利于维持存储市场的高流动性,全网存储总量将会受到抑制;如果代币发行的通胀率偏高,在未来一定时期内代币的发行量是递增的,很容易造成代币兑法币(一般是美元)长期呈贬值趋势,那么矿工的铸币交易产生的收益会大幅缩水,从而导致矿工买入磁盘的投入高于因提供存储空间产生的收益,若买入GPU矿机挖矿则更会入不敷出,从而导致进入项目壁垒较高。目前,MaidSafe、Storj、Sia和Lambda等项目陷入了第二种困境。 (4)如何快速稀释全网总存储的集中度 去中心化存储项目在初期,全网总存储将不可避免地集中在少数存储供应商手中,它们大多数以合伙人的身份参与到其中。全网总存储的大规模集中容易发生51%攻击,不论攻击方是单个存储供应商还是矿池,甚至是“多方合谋”。导致大多数家庭用户掌握的存储份额越来越低,导致存储区块链从“非许可型”变质成“许可型”,从而导致其代币的需求下降并陷入长期贬值趋势,全网的流动性大幅减弱,甚至大型存储供应商的流失。 5.2. 去中心化存储发展建议 针对5.1节的去中心化存储的发展瓶颈,我们对未来去中心化存储项目的布置提供以下参考建议: (1) 引入稳定币的机制使费用趋于稳定; (2) 检索应当免费; (3) 使用Hash加密时让区块头上的根哈希值与上一个区块头的根哈希值高度相关,让特定存储内容的共享网络的其他节点有更强的动力去验证其存储文件的完整性和可用性; (4) 设计合理的共识机制,让出块概率与提高有效存储总量呈线性正相关; (5) 降低提供存储的进入壁垒,让家庭用户可以以存储矿工的身份参与到存储网络当中,不要让过多的全网总存储集中在少数存储供应商的手上,建议以存储空间的绝对值为度量实施有效奖励,而非比例。
参考文献 [1]袁煜明,刘洋.《区块链技术可扩展方案分层模型》 [2]彭俊.复杂网络的拓扑结构及传播模型的研究[D].西安:西安电子科技大学.2009 [3]海沫,朱建明.区块链网络最优传播路径和激励相结合的传播机制[J].计算机研究与展.2019,56(6):1205-1218 [4]《Filecoin白皮书》: https://filecoin.io/filecoin.pdf [5] E. Adar and B. A. Huberman. Free riding on gnutella. First Monday, 5(10), 2000 [6]《BitTorrent白皮书》: https://dwz.cn/dKuhcIRR [7] Bram Cohen. Incentives Build Robustness in BitTorrent. bram@bitconjurer.org. 2003 [8]《Lambda技术白皮书》: https://dwz.cn/yktCaGCp [9]《Lambda经济白皮书》: https://dwz.cn/ftm1Wl6d [10]《Storj V3白皮书》: https://storj.io/storj.pdf [11]《Sia白皮书》: https://sia.tech/sia.pdf 高清PDF版原文链接:https://pan.baidu.com/s/1Ljg6ZWXFt6ychJpHdKUlbA 提取码:20cq
2、去中心化存储是什么? https://www.jinse.com/blockchain/870158.html 在大型、集中式的数据中心中存储数据,往往存在性能、可用性和可扩展性等方面问题,同时也会带来较高的资本或运营支出。而且,集中存储数据也极易受到复杂网络攻击。出于这些原因,企业开始寻求去中心化数据存储的方法。 去中心化存储可以把数据分布到多个网络节点,类似于区块链的分布式账本技术。存储供应商(托管主机)基于协约来存储客户数据,并定期地证明它们能继续提供存储服务,直到协约到期。 主机可以通过提交证明得到奖励,但是丢失证明会受到相应的处罚,这些证明在区块链上是公开、可审计的,网络自动保证存储合同的一致性,这就意味着,客户不需要去验证合同,他们只需要上传数据,其它的都交给网络去做;用户也可以将自己电脑硬盘的存储空间进行出租,同时将获得一定的token作为报酬,而拥有Token的人则可以租赁其他用户的硬盘存储空间,基于区块链技术的去中心化特征,这些来自全球的使用者们可以将自己的空余硬盘空间组成去中心化的网络,而这些空余的硬盘空间就变成了去中心化网络的节点。数据将被切割成小块,经过加密后,分散存储在众多节点上。
3、去中心化存储赛道核心项目全分析:Filecoin、Storj 与 Arweave https://www.fxajax.com/20210616220931.html 撰文: 小毛哥 @ FxAjax、咖啡 @ 头等仓 2020 年是去中心化存储领域关键的一年,就在未来两个月内,会有包括 Filecoin、Storj 在内的重量级去中心化存储项目发布产品进展。该赛道及该领域的核心项目值得关注。 以存储作为服务的商业模式由来已久,亚马逊公司在 2006 年开始推出 Amazon Web Services(AWS),将自己的服务器和存储空间租借给用户,降低了开发者创建并管理服务器基础设施的开销。 随着时间的演变,传统云储存服务虽不断改善功能,价格也愈加亲民,但近年来陷入一个瓶颈,即无法解决频繁的数据泄露问题、服务的限制性、运营商停运风险等问题。于是,想要从根本上解决传统存储商业模式的弊病,去中心化存储这一概念逐渐兴起。 去中心化存储网络(Decentralized Storage Network, DSN) 是一种通过分布式存储技术将文件或文件集分片存储在供应方提供的存储空间上的存储商业模式。
我们从应用的角度将中心化存储类项目分为两类: 第一种是以硬盘空间作为算力证明进行挖矿、对标比特币为主的货币类项目,这类型项目主要以包括 Burst、BHD 在内的 PoC(Proof of Capacity) 共识项目为代表; 第二种是以有效存储为算力挖矿来赚取租金,实际是提供存储服务为主的应用型项目,比如 Filecoin、Storj、Sia 等项目。 图片: https://uploader.shimo.im/f/IFG5yLl5oVqqaxEs.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo 采用 PoC(Proof of Capacity) 项目共识机制的项目主要对标比特币,以节约能源,更分散,更公平的挖矿等作为核心竞争力,旨在成为一个更好的加密货币。我们在本篇文章所要聊的去中心化云存储项目,指的是第二种存储应用型项目,而 2020 年也是该领域关键的一年。
为什么要关注去中心化存储领域? 基于以太坊的去中心化存储网络 Storj 宣布将于今年一季度发布正式版本,并公布了一系列可期待的新功能。备受瞩目的巨型项目 Filecoin 之前多次延期,现在也已经完成测试网一级阶段,即将开启测试网第二阶段,并计划于 3 月 23 日至 4 月 24 日之间启动主网。 首先,2020 年是去中心化存储领域关键的一年,该领域技术开发已有多年基础,虽然此前有多次跳票,但目前技术已趋于成熟,2020 第一季度将会有包括 Filecoin、Storj 在内的重量级去中心化存储项目发布产品进展,这些厚积薄发的项目竞争也有望带动整个领域的火热,并与其他区块链应用组合出更多全新用例。 其次,去中心化存储商业模式明确清晰,市场规模呈增长趋势,对于矿工来说,整个市场是有利可图的。若可以在 2020 年开始实现大规模商用,并随着 Web 3.0 生态的发展、对隐私和用户数据所有权的重视,今年将成为去中心化存储领域的技术突破和产品落地之年,下面我们就选取一些值得关注的项目,并分别分析其优势和劣势。
Filecoin Filecoin 自其 2017 年上线之初就获得超过 2.5 亿美元的融资,Filecoin 有可能是 2019 年凤尾、2020 年龙头,其计划于 2020 年第一季度上线主网也是今年区块链世界最值得期待的大事之一。Filecoin 有望带动整个去中心化存储赛道的火热。 我们分析该项目的优势: 项目体量巨大、资金充沛,目前生态系统完备,有利于扩大应用规模 Filecoin 网络主要由独立的数据存储矿工、检索矿工、以及雇用矿工的存储服务客户组成,存储服务的客户可以通过存储市场和检索市场这两个分布式的、可验证的、激励性的市场来雇佣矿工。Filecoin 与其互补的分布式网络传输协议 IPFS 都是由 Protocol Labs 开发。 作为去中心化数据存储网络,Filecoin 既是作为 IPFS 的存储层,也是 IPFS 协议的激励层,IPFS 是整个系统的应用层,两个协议共享多个功能模块。 IPFS 主要对标 HTTP 协议,旨在对互联网的超文本传输协议 (HTTP) 进行补充甚至替代。IPFS 的愿景非常宏大,希望充当 Web 3.0 的存储层并建立新的互联网架构。 目前有超过 50 亿个文件已上传至 IPFS,有超过 100 个区块链项目采用 IPFS 存储数据及文件,现已成为去中心化网络的重要基础设施之一。 图片: https://uploader.shimo.im/f/L0m27F9VEDBPedMt.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo
Filecoin 竞价撮合机制有利于降低存储服务价格 Filecoin 矿工通过提供存储空间,以有效存储作为算力,参与网络治理,竞争区块打包权。该网络有两种类型的矿工,一种是检索矿工,一种是存储矿工,检索矿工赚取检索费,而存储矿工赚取存储租金以及区块打包的奖励。以 Filecoin 的机制来说,整个网络通过区块奖励来支付矿工硬件成本,以此来提供存储服务,存储服务以竞价撮合交易,该竞价撮合机制有利于降低存储服务价格。 我们分析该项目的劣势: Filecoin 挖矿硬件要求较高,无法保证普通用户的参与度 Filecoin 团队此前公开用户参与其测试网的硬件信息,目前要求为打包 32GB 的扇区,需要至少 128GB,甚至 256GB 内存。虽然该要求不代表最终主网的硬件标准,但就该硬件要求来说,无法让所有个人电脑参与挖矿,整个网络有趋向中心化的各大机房、数据中心之争的风险。 另外,以目前 IPFS 网络的下载速度来说,要达到企业级服务的要求,其性能及速度还需要进一步提高。 运行 / 开发现状 Filecoin 于 2019 年 12 月 11 日推出公共测试网。Filecoin 已公布其完整的 2020 年路线图,目前测试网第一阶段已经完成,第二阶段测试目前尚未展开。该项目计划于 3 月 23 日至 4 月 24 日之间上线主网。 图片: https://uploader.shimo.im/f/6VravXJipXHHrHmm.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo 目前 Filecoin 测试网运行稳定,根据 Filecoin 测试网显示,截至 2020 年 2 月 5 日,区块高度为 42511,平均区块时间为 47 秒,全网总算力为 1.2 PiB。根据 Filecoin 最新发布的路线图,2020 年 1 月 17 日将会完成测试网第一阶段,该阶段主要对 Filecoin 进行一些基本功能测试、优化和 bug 修复。 之前 Filecoin 曾计划在 2020 年 1 月 20 日到 3 月 20 日的测试网第二阶段,进行 Filecoin 网络正式测试、验证和安全审计,并将启动可信设置,发布更新主网硬件测试配置,发布开发工具协作包。不过,考虑到中国的春节,该项目后来修正了测试网第二阶段的发布时间,提出不会在中国春节期间发布测试网第二阶段。Filecoin 表示,测试网第二阶段的具体启动时间将取决于 go-filecoin 和 lotus 实现之间互操作性测试的时间长短,目前具体启动时间有待确定。 图片: https://uploader.shimo.im/f/0Gphe62UihKhkglb.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo 了解更多参与 Filecoin 测试网的信息,可以查看这篇FxAjax对 Filecoin 团队的采访:《听 Filecoin 团队回应测试网上线你需要了解的核心问题》。
Storj Storj 创立于 2017 年 7 月,是一个基于以太坊的分布式云存储协议,由盈利性公司 Stroj Labs 开发。 Storj 旨在搭建免审查、免监控且不停机的去中心化云存储平台,通过利用闲置硬盘和带宽,在 P2P 网络上任何节点之间都可以进行磋商、数据传输、验证数据完整性和可用性、检索数据、并进行存储。 我们分析该项目的优势: Storj 的模式更偏向商业化,更适合企业级存储业务 虽然 Storj 提供基于区块链技术的存储服务,但该项目直接对标亚马逊的 S3 对象存储服务, 希望为企业提供各项性能指标都堪比、甚至超越亚马逊存储的服务。若项目进展顺利,Storj 将成为最具商业竞争力的去中心化存储平台之一。 Storj 的每个里程碑都是以量化的指标为主的,只有达到这些指标,Storj 才能进入下一个里程碑。Storj 的存储原理是将上传的文件先拆成 64M 大小的数据块,然后将 64M 大小的数据块,经过 2.7 倍的冗余,再切分成 80 个数据块。这 80 个数据块会分散到网络中的 80 个节点上。这样,只要保证这 80 个节点有任意 29 个节点在线,都可以完整恢复这个文件。以文件读取率指标为例,Storj 正式版的目标是达到 99.9999999% 的文件读取率。 Storj 表示目前网络有超过 4,800 个存储节点处于活跃状态,V3 版全新开始后,全球总存储量已经超过了 10PB。 若 Storj 在今年达到正式版,存储节点的数量将达到 5000 个,文件上传和下载的速度将会较亚马逊存储持平,具体各项指标可以查看官方博客文章: https://storj.io/blog/2019/11/measuring-production-readiness-using-qualification-gates/ 图片: https://uploader.shimo.im/f/l5e3XpAOsw9ilOg3.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo
Storj 更适合普通用户进行挖矿并参与,更适合整合闲置资源以扩大生态 Storj 用户可以通过提供存储空间收取租金,或租赁存储空间支付租金。绝大多数的小型设备,如 NAS、个人电脑、树莓派、都可以安装 Storj 节点,出租自己的闲置空间,适用于搭建一个极度分散化的云存储网络,适用于平民化挖矿。Storj 自诩为去中心处存储中的 Uber ,可以把社会闲置资源重新组织成可用的商业产品。 同时,Storj 官方推出了「Storj Labs 开源合作伙伴计划」,开源软件商如果有开发接入 Storj 的接口,并有用户通过它的开源软件使用了 Storj 服务的话,会得到 Storj 的收益分成。目前官方还未公布具体分成比例,但这一举措可以鼓励开源软件开发者,进而扩大 Storj 的应用生态。 我们分析项目的劣势: Storj 存储网络架构有一定意义上的中心化 目前 Storj 矿工薪资的发放是每个月第一周,由官方团队人工发放。同时,Storj 的网络结构里有一个负责协调存储用户和存储节点之间所有存储合约的第三方角色 ——可信 Satellite(卫星)。当然,需要特别说明,这种「Satellite」可不是天上飞的卫星,而是内容检索的服务集群,每一个 Satellite 相当于充当了 IPFS 网络里面的检索矿工的角色。 图片: https://uploader.shimo.im/f/LWdPrWSPW3ik8tdE.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NDExMTc2MzksImciOiJpV1BOdGUzSVV3SVc1amRKIiwiaWF0IjoxNjQxMTE3MzM5LCJ1c2VySWQiOjI2ODYxMjUyfQ.xJLQBKzy6jpv_gEUFf_voVjZfC4qQ8zfj-Of09OKvEo
由于 Storj 是开源的,未来人人都可以申请运行 Satellite, Satellite 可能会出现单点故障的风险,也就意味着如果单个 Satellite 故障,那通过该 Satellite 存储的所有数据将会无法访问。 目前 Storj 是通过把 Satellite 拆分成多个服务来解决该问题,虽然发生的概率较低,但不可避免的仍然有理论风险。同时,Storj 也将运行一组称为 Tardigrade Network 的特定可信 Satellite,旨在给客户的数据可用性和持久性提供一个保证服务水平协议 (SLA)。 Storj 的代币激励机制或影响项目初期的代币价格 Storj 支持用户使用信用卡或 Storj 代币支付存储服务帐单,而且会从收入中抽取 40% 做为团队薪资以及开源合作伙伴计划的支出,剩下的 60% 将会转换成 Storj 分配给矿工。当用户使用信用卡支付时,这 60% 的资金并不是从市场上买入 Storj 代币去发放给矿工,而是从团队的储备代币里面去换取 Storj 发放给矿工。 目前团队储备的 Storj 代币还有大概 2.8 亿个,只有当这 2.8 亿个代币转换完成后,才有可能直接从市场买入 Storj 代币去分发给矿工,这也决定了 Storj 的代币价格或将在一段时间内无法受到有效的激励。 运行 / 开发现状 目前 Storj 的产品路线图将在今年有重大进展,Storj 宣布将于今年一季度发布正式版产品,并公布了一系列可期待的新功能,包括: 将支持更多存储节点新平台,包括增加对 Qnap、Synology 和 Western Digital NAS 设备上运行节点的本地支持,以及对 FreeNAS 和 FreeBSD 的支持。针对开发者,Storj 增加了候补名单的名额,在开发者推荐计划中,活跃开发者可通过推荐其他开发者进驻该平台获得存储和带宽积分。从候补名单中激活的 Beta 帐户,将可免费获得每月 25GB 的存储和带宽,投入生产后,前 10,000 个开发者帐户将可获得 1TB 的信用额度,包括 30 天的存储和带宽价值。即将发布的新版本允许 NAS 运营商轻松地将未使用的 NAS 容量添加到网络中,并将支持将 NAS 硬件备份到 Tardigrade 存储中。
Arweave Arweave 是主打 一次性付费并获得永久文件存储的协议。Arweave 提供一种名为 Permaweb 永久网络的存储解决方案,利用区块链不可篡改的特性,直接把内容写入区块进行存储,以实现所谓的永久存储功能。 该项目利用访问证明(Proof of Access, POA) 激励矿工永远储存历史并根据要求分享,矿工在获得新的区块奖励的同时,同时也会因存储链中随机的旧区块而获得奖励,这意味着矿工存储的总块数越多,获得的收益就越多。 Arweave 的挖矿采用了 RadomX 的算法,同时在此基础上引入了区块完整率的参数。 由于 Arweave 的特性决定了其区块大小一定是随着网络的使用指数级上涨的,考虑到日益膨胀的区块数据,未来节点或有无法存储完整的区块数据的风险,因此,引入区块完整率的参数,不要求所有节点存储完整的区块数据,而且根据节点存储的区块数量多少来竞争区块打包。 我们分析项目的优势: Arweave 主打一次性付费并获得永久文件存储,补齐市场缺口 不同于 IPFS 主打去中心化存储、Storj 主打企业化存储服务,Arweave 主打永久存储,补齐了特定的市场需求,从根本来说,Arwaeve 解决的是如今互联网的言论自由受限、过度审查、易于篡改的问题。 具体应用来说,特别是在网络访问受限较多的地区,互联网用户无需下载新的浏览器,可以通过 Arweave 浏览器插件实现在区块链上永久存储网页、邮件、社交媒体发帖等数字文件和数据,完整真实地保留历史。 同时,Arweave 也可以帮助机构存储完整、不可篡改的知识及信息,比如用于存储气候变化数据库,目前 Arweave 与美国国家海洋与大气管理局合作将正在进行的二氧化碳测量值进行永久存储以测试 Permaweb。 Arweave 表示,将提供数据存储成本类似摩尔定律式的下降,用户只需要支付一次性的预付款 (每兆字节约半美分),而超额付款所产生的利息将帮助后续存储服务继续下降。Arweave 创始人 Sam Williams 表示,「近几年,Arweave 数据存储成本平均每年下降了 30%,只要该比率不低于 0.5%(按照如今的存储需求),去中心化网络仍然能够负担成本,如今的付款将将涵盖未来 200 年的存储空间的成本」。 我们分析项目的缺点: 实际应用场景较窄,不便于开发者使用 Arweave 特性能应用于以 HTML5 网页为主的数据保全,建立去中心化 H5-APP,但在实际使用中, 我们发行该存证的应用场景较窄,目前可以看到目前在 Arweave 上存储的最多的是推特的一些反政府言论的截图,明确的反政府应用增多是令人担忧的。 同时,Arweave 的特性是永不可篡改,这在程序开发上显得尤为困难,因为开发者上传到 Arweave 的程序必须任何错误都不能有,如果有错误,哪怕是一个标点,之前上传的内容都要作废,需要重新上传,势必造成大量无用垃圾堆积。另外,由于区块链的开放性,Arweave 上传的内容都是面向全社会开放的,不适合上传个人内容。 虽然该团队表示,Arweave 与 IPFS 兼容,在 IPFS 上构建的开发人员可以无缝过渡到 Arweave。但是开发者若是基于 Arweave 开发,会出现无法直接对自己的 HTML5 APP 进行升级的问题,开发者必须直接放弃旧的版本,重新上传新的版本,势必会出现一定的不便性。 商业模式较为简单,可能引发同质化项目的价格战 Arweave 主打主打一次性付费并获得永久文件存储,该模式较为简单,有一定风险会引发同质化项目出现利用相同的存储概念并打响价格战。 运行 / 开发现状 Arweave 项目于 2017 年创立,目前 Arweave 的主网已于 2018 年 6 月上线。 Arweave 表示,目前基于 Arweave 构建的永久性应用有 100 多个,包括通过转账将电子邮件内容写入区块的永久电子邮件存储客户端 Weavemail。 根据 Arweave 官方网站信息显示,目前全球有将近 300 多个节点, 最多为德国,有 223 个节点,美国有 150 多个节点,中国有 3 个节点。同时根据 Arweave 的转账数据显示,进入 2019 年 11 月以来,Arweave 的转账数量明显增多,但每日转账数量参差不齐,最低时每日仅有 1,000 多次转账,而在 2019 年圣诞节前后转账数量达到历史高峰 2,5125 次。
在融资方面,Arweave 此前曾获得 1kx 投资,并在 2018 年 6 月通过 ICO 融资 870 万美元。2019 年 11 月,Arweave 宣布完成 500 万美元融资,由加密资产投资机构 a16z 领投,联合广场风投(Union Square Ventures) 和 Multicoin Capital 参投。 Multicoin Capital 管理合伙人 Kyle Samani 在《Web3 堆栈全景》一文中提到,「不管底层数据位于何处,包括 Arweave 存储协议在内的链上中间件所提供的服务将充当开发人员的单一抽象层,此类服务将加快整个 Web3 生态系统的发展速度」。
4、生态中为数不多的万亿市场:去中心化存储 https://bicoin8.com/89502.html 去中心化存储的界定 首要咱们需求清晰,终究什么是去中心化存储,以及它与分布式存储又有什么区别。依照比较常见的理解,去中心化存储指的是在一个存储网络中,没有中心化组织作为存储体系的背书,而是相对独立的单个或部分集体奉献自己的存储空间作为该存储网络的组成单位,如此绕开了中心化组织存储带来的数据绝对操控权。 而分布式存储的概念则存在更久,依照更广义的说法,分布式存储体系是将数据分散存储在多台独立的设备上。分布式存储是指的架构上是分布式的,而去中心化存储则是指存储的内容是不受一个中心组织或单个所操控的。所以,去中心化存储必定是分布式存储,可是分布式存储纷歧定是去中心化存储。咱们常见的“云盘”便是分布式存储的一类,但其背面是有中心化组织所管控,它能够随时删减、修正咱们存在其间的数据,这与去中心化存储大相径庭。 因而,去中心化存储被认为是未来存储范畴更加广泛和落地一类存储方法,既能够增强存储数据的安全,乃至还能削减存储本钱。 去中心化存储与容量存储的项目有什么区别 当然,谈到去中心化存储,咱们不得不说到另一个简单被误解的东西,也便是最近大火的相似Chia这样的所谓去中心化存储项目,但本质上,Chia供给的并非真实意义上的去中心化存储,而仅仅是一种相似比特币相同的“容量证明”。 Chia本质上只是把存储空间的巨细(容量,Capacity)作为衡量网络参加者奉献的依据,这意味着存储空间越大取得的收益越多,而实际上并不能供给存储空间,用于咱们的生活和作业的需求,这与咱们期望的去中心化存储有较大区别。 回到真实的去中心化存储上来看,它应该是以供给存储空间(Storage)的服务质量来衡量对网络的奉献值,如此才算真实意义上的去中心化存储设备,而且才干有围绕着去中心化的存储空间诞生出许多优秀的去中心化运用,而下文说到的IPFS协议才算是当时阶段更契合去中心化存储开展的趋势。 去中心化存储中的重要协议——IPFS 在《Minecraft》被收买的同年,一个名为Protocol Labs(协议实验室)的组织加入了美国顶级孵化器Y-Combinator,随后该协议实验室于2015年1月向国际发布了IPFS(InterPlanetary File System),它是一个面向全球的、点对点的分布式版别文件体系,也被称为“星际文件体系”,经过该体系能够完成数据的点对点传输,存储的去中心化。 另一方面,IPFS的方针还想补充乃至是替代现在统治互联网的超文本传输协议(HTTP),以完成更安全、更安稳和更快速的网络传输。 而要成功构建去中心化存储的网络,除了有像IPFS这样的协议还不行,由于凭什么让其他人乐意供给存储空间到IPFS上呢? 这就需求在这个协议之上搭建一个鼓励层,为供给存储空间到IPFS的参加者供给加密钱银的鼓励,于是IPFS的团队协议实验室在学习了比特币的思路后,推出了Filecoin的区块链项目,作为IPFS的鼓励层。 当然,并不是说IPFS的鼓励层就只能是协议实验室做的Filecoin,由于IPFS是一个敞开的协议,其他团队也能够依据IPFS构建另一个鼓励层,究竟技能研发的路上没有仅有的正确答案。 相同的,“IPFS+鼓励层”的思路也并不是仅有的解决方案,咱们也看到了其他一些项目是经过自己构建协议并把区块链的token奖励机制集成在一起,以此搭建出另一个去中心化网络的思路,也由于他们的进入,让去中心化存储开展日益结实和深入人心。
比中心化贮存有更多的优势 1.1、内容存储去中心化,避免遭到中心化要素的危险 现在再翻开咱们十几年前常常阅读的网站,会发现他们之中的许多网站现已打不开了,显现404 not found,这是告诉咱们这个页面现已不存在了,究其原因,是由于咱们现在看到的网站内容,全都存储在一个中心化的服务器中,当网站的运营者不再付出服务器的本钱,这部分内容就会被服务器办理方删除,而网站的一切信息也都将永远的消失了。 像相似这种由于中心化存储的办理方删除了内容,又或许是被网盘删除了咱们存在云端的内容,等中心化的危险,将不再发生。IPFS允许内容以去中心化分布式的存储在不同的存储空间中,没有任何一个主体能够修正、删除存储的内容。 1.2、存储内容能够取得隐私维护 由于存储的文件会被拆分红很多份,再被加密的存放到不同的节点。因而,存储方并不能知道存储的内容是什么,能够有效地维护咱们的隐私,不会呈现之前的Facebook的5000万用户材料被走漏的状况。 1.3、更有效的进行备份,能够防止单点故障 由于存储的内容是分散到不同的当地,经过数据冗余的方法,能够有效地防止由于单点故障形成的数据丢失。传统的云存储尽管也能挑选备份多次,可是备份再多依然是受控于该云存储的公司,其安全性并不能跟着备份数量的添加而明显添加。 1.4、极大的节约现有的存储空间 IPFS有去重的功用,IPFS在存储文件时,会默许在全网备份三份(也能够自己挑选备份更多),之后相同的文件不会被再次存储到网络中。相比于咱们现在的存储状况,比方电影《阿凡达》,在2016年一年的下载次数就达到了1658万次,总下载数量更是惊人,有很多的空间被同一部电影所占据,而IPFS的去中心化存储能够极大地削减存储空间的占用,前进存储空间运用率。 1.5、本钱更低 相比于中心化的存储,会集中的占用很多的带宽,去中心化存储理论上能够下降一半以上的带宽消耗,下降网络本钱。而且去中心化存储在建造和运维层面也能够极大的下降本钱。 1.6、速度更快 由于网络能够首要挑选离用户更近的节点服务,而且天然支撑P2P加快等技能,使得读取数据的速度相较于传统存储更快
Web3.0的重要根底设备 Gavin所界说的Web3.0会是一个可扩展的一系列技能结构,并用一种全新的方法构建运用程序,经过这种新的运用,他期望每个人都能掌握自己的(数字)身份、财物和数据,进而掌握自己的命运。 要做到这一点,一个去中心化的网络是必不行少的,而这正是区块链技能在Web3.0中所担任的重要人物。可是关于现有的区块链来说并不能彻底满意Web3.0的需求,区块链本身也面对一些“存储瓶颈”。 现在的区块链存储的内容十分有限,并不能让一切的数据都去中心化。而且,在区块链存储十分有限的当下,其本身的账本也变得越来越大了, 而区块链技能本身是经过一切节点都存储相同的账本来达到不行篡改的,所以节点数越多,单个账本的存储空间也在变多,这会使得光是存储区块链的 账本就要消耗很多的存储资源。 所以,区块链+去中心化存储便成为了重要的解决方案。一方面,能够让区块链项目不再困扰于账本越来越大,将区块链的账本放在IPFS这类去中心化存储网络上,可极大地削减单个区块链项目的账本存储空间,让成为全节点变得越来越简单,也更利于区块链项目进一步去中心化。 另一方面,能够让更大的文件,比方图片,视频等也变得去中心化,这也十分契合当时火爆的NFT生态,NFT本便是属于个人的数字财物,但现在一些大的NFT财物,比方图片和视频,还做不到让其本身放到脸上,但假如结合了去中心化存储,便可让NFT不再受制于数据巨细和方法,这将给NFT带来更多的拓宽方向,也带来了区块链运用的更多或许。 跟着科技的开展,尤其是相似VR/AR等显现技能的提高,未来咱们乃至或许看到相似《头号玩家》那种场景:每个人都能经过一些VR/AR等智能设备进入一个虚拟的数字国际,在这个数字国际中,每个人都有属于自己的房子,数字钱银,数字财物等。咱们能够把存储空间看成是数字国际的土地,而构建于数字国际的各类运用便是土地之上的各种类型的建筑了。其间去中心化的属性是最重要的,由于你总不期望在数字国际里的房子是能够随时被别人窥探内部,或许随时或许被某个中心收回的吧。 所以,去中心化的存储便是承载这个数字国际的基石,也是Web3.0的重要根底设备。 5G引领的数据爆破年代的重要根底设备 跟着5G网络传输技能的前进,其他围绕着数据的技能,比方智能家居、物联网、VR/AR、智能汽车等也在乘上这班快车,并快速进化中。依据此,智能设备会遍布国际上的每个旮旯,万事万物都能够记录并搜集数据,能够预见在不久的几年后,咱们每天发生的数据会呈指数级添加。 据IDC猜测,全球数据圈的规模将由2018年的33ZB添加至2025年的175ZB,且文本、图片、视频等非结构化数据将具有更高的添加率,在全体数据圈的占比也将继续添加。 可是现有的中心化存储方法始终有瓶颈,正如咱们之前说到的,它并没有去重的功用,一份文件有或许在网络上存储成百上千份形成很多的糟蹋。尽管像亚马逊、阿里、腾讯等科技巨子现已纷繁声明将在未来几年斥巨资修建很多的数据中心,但数据爆破的扩展速度很或许会超过数据中心的建造速度,更重要的是,传统中心化的存储方法决议了它仍会糟蹋很多空间在 存储相同的内容上,所以不在根本上改变存储方法,是难以适应年代的开展的。 因而,去中心化存储必定会登上历史的重要舞台。而且,存储商场的扩容,也决议了这块蛋糕注定不能被巨子垄断,以去中心化存储的方法, 全民参加数字国际的建造必定是未来的趋势。
去中心化存储项目开展状况 去中心化存储作为区块链运用的重要场景,当时现已呈现了很多优质的项目。咱们以Filecoin、Storj、ARweave为例,简明扼要的论述当时去中心化存储项目的开展状况。 Filecoin Filecoin是IPFS背面的团队——协议实验室所做的IPFS的鼓励层区块链,IPFS本身作为协议现已能够正常运用了,可是假如没有鼓励,其他人凭什么会乐意将存储空间供给给IPFS呢?于是Filecoin便承担了鼓励的人物。 Filecoin的方针是构建一个依据IPFS的存储商场和检索商场,一起也是一个开源的云存储商场、协议和加密财物,是较早呈现而且一致最大的去中心化存储项目之一。 在Filecoin中,矿工是网络的重要参加者,与以往常见的挖矿不同,他们供给的不是核算才能,而是存储才能,切当的来说是依照所供给的有效存储空间为依据来判别参加者对整个网络的奉献值,并依据奉献的占比取得区块奖励。 当时Filecoin现已具有了足够的存储供给,达到了存储算力超过网络基线的根底方针,并开端了其加密经济鼓励机制向第二阶段的中期愿景跨进的新篇章。其鼓励方针从粗豪的容量建造转向建造与供需相匹配、全面可继续开展的容量。未来的Filecoin会向着更加高效的方向跨进。 而于此一起,有很多优秀的项目加入到Filecoin生态Showcase计划之中。涵盖了数据库、DeFi、中间件、买卖渠道、云教育、医疗等多个范畴,并与Wolfram Blockchain Labs、Chainlink等达到了合作。
Storj Storj Labs供给了端到端的加密和负担得起得分布式云存储,是一个去中心化依据区块链的分布式云存储体系。其底层根底是依据以太坊构建的。Storj运用其社区成员共享得备用磁盘驱动空间为开发人员、运营团队、公司和其他需求安全云存储的人员创立一个安全网络。其方针是成为抗检查、不会停机的去中心化云存储渠道。 Storj 网络包括三个主要组件 : 存储节点、卫星和上行链路。存储节点的作用是存储和返回数据的。上行线路(Uplink)是一种软件或服务,它能够把数据输入进去或直接从网络中获取数据。卫星(Satellite)的作用是作为上行线路和存储节点之间的一个中介,它能够促进存储交互,并决议哪个存储节点将存储哪些文件。 卫星与存储节点的关系是十分重要的。卫星担任向存储节点付出网络运用的存储和带宽费用。存储节点则期望为网络存储尽或许多的数据,这样它就能赚到最多的钱,而要完成这一点,在很大程度上需求依赖于卫星的帮忙。两者相当于生产方与途径方的相辅相成的作用。 当时Storj现已有2万个租户,1.8万个矿工和8PB的存储空间能够进行运用。能够接受BTC、ETH和Storj通证多种方法进行付出,而且与ETC Labs、zkSync等多个项目达到合作关系。其商用化云存储渠道Tardigrade已投入运用,正在为企业级用户供给去中心化数据存储服务。
ARweave Arweave则是另一种思路的IPFS鼓励层,它的方针是供给依据区块链技能的永久保存数据,是一个永久性的无服务器网络。Arweave认为数据存储本钱和摩尔定律相似,会逐步下降,所以用户只要将数据添加到区块链上时才需求付出存储费用。一起Arweave不会要求节点保存一切的区块数据以添加区块链的持久性。 Arweave挖矿的设备要求和家用电脑接近,只需求4核8GRAM和512G的硬盘就能够参加。矿工经过作为节点存储数据取得鼓励,保存的区块数量越多,越或许取得出块奖励,取得的出块奖励也越多。 当时Arweave网络中存储的数据达到了7.85TB,而且在全球有151个节点,平均日买卖量达到了26110笔。单日运用数据达到了888GB的历史高点,越来越受个人用户的青睐。 去中心化存储供给了一种安全、私密且价格低廉的去中心化存储方法。跟着越来越的人对去中心化存储的一致和需求的添加和监管的规范化,去中心化存储项目正在逐步成为干流。
波卡上的去中心化存储 有了干流的去中心化存储项目的思路,波卡生态上的去中心化存储项目又是怎样的状况呢? Filecoin转接桥 Filecoin其实也能够看做是波卡生态之一,Filecoin也一向与波卡有某些根由。 Filecoin的创始人Juan一向是Web3.0的忠诚信仰者,而其Filecoin和IPFS所做的去中心化存储也正好是Web3.0的重要组成部分。当波卡背面的Web3基金会举行Web3 Summit时,Juan作为Web3.0的布道者,自然成为了Web3 Summit的常客,在2018年和2019年都能见到他在大会上共享对Web3.0的见解。(假如不是2020年疫情的影响,咱们或许本能够再会到他参会) 而去中心化存储Filecoin+IPFS在Web3.0的奉献也取得了波卡创始人Gavin的认可。2019年12月,当波卡创始人Gavin Wood在一场推特上的AMA活动上,被问及:现在 Substrate 的贮存方法有哪些?我知道有 Substrate LFS 和 Substrate 中心概念的存储 。路线图是怎样计划的? Gavin表明:咱们正在研讨一种作为平行链的初始存储解决方案。不管咱们做什么,它都很或许集成到 IPFS 中。我也期望当 Filecoin 上线的时候能桥接到它。 因而,将Filecoin及其背面的IPFS作为波卡生态的一部分,是有据可依的。而从Gavin的表述来看,未来Filecoin很有或许取得一条公共利益平行链作为官方支撑的Filecoin转接桥。 当然,波卡生态并没有限定一条公链只允许有一个转接桥。以以太坊为例,除了官方支撑的SnowFork所做的以太坊转接桥,其他还有比方Plasm、Darwinia也都在做以太坊的转接桥。同理,Filecoin作为重要的生态,也有许多其他的波卡生态项目想要将Filecoin桥接到过去,并经过自己链接到波卡生态上。 2020年3月,波卡的生态项目ChainX透露正在开发Filecoin桥,ChainX作为财物跨链网关,其方针是将任何有价值的财物接入区块链网络,从而构建万链互联,价值自由传递的Web3.0生态。而Filecoin或许会成为一切区块链项目的根底设备,借助IPFS技能和Filecoin网络,能够解决存储方面的问题,这便是ChainX接入Filecoin的原因。
Crust Crust是去中心存储的鼓励层协议,包括了IPFS在内的多种存储层协议,并对运用层供给支撑。一起Crust的架构也有才能对去中心化核算层供给支撑,构建一个重视数据隐私和一切权的分布式生态。 与Filecoin不同的是,Crust并不是一条独自的公链,而是Polkadot的平行链。依据Substrate结构开发,一致算法、链下作业机、晋级机制等都和波卡生态保持一致,所以Crust链的成熟度反而比Filecoin更高。 由于Crust中心证明机制经过依据TEE的本地存储校验完成的,并不需求很多的算力,下降了对矿机装备的要求,一起矿工在Crust挖矿时不需求预先购买Token进行“前置抵押”。有许多家用办公等级的处理器就能够进行挖矿,挖矿门槛更低。 当时Crust推出了与主网功用相同的Crust Maxwell测试网,集成了代币质押、去中心化存储商场DSM及文件检索机制等中心功用。而且在社区得到了极好的反应。一起Crust推出了三大运用场景,分别为去中心化网络部署及运行、NFT数据存储、P2P内容存储及分发,与Uniswap、PolkaApps、Kaka、Coinversation等生态项目展开了合作。
对当下去中心化存储现状的总结和考虑 纵观当时干流的去中心化存储项目,咱们十分看好这个生态位的远景,可是依然有一些状况值得咱们考虑。 1.考虑 1.1、商业运用场景仍未得到大规模验证 尽管单个项目在探索商业化落地,可是间隔大规模的商业落地还遥遥无期,而像Filecoin这样的闻名去中心化存储项目,还停留在挖矿阶段,所以, 去中心化存储如何让传统所接受是一个值得探索的问题。 哪个项目能克服这个困难,就好比是Coinbase上市之后,能够直接获取到传统范畴的海量商场相同。 1.2、经济模型存疑 像Filecoin所要构建的存储商场和检索商场,其间是用其通证FIL作为付出的前言,那么这里就会有一个问题。流通的需求与币价的涨跌是相互按捺的。假如A是存储供给商,B是购买存储服务者,当B付出必定数量的FIL给A时,假如token涨了,A就赚了,可是对B来说就亏了,他就不那么情愿去付出;反之,假如token跌了,B就赚了,可是对A来说,收到的钱就少了,他就不那么乐意收款。所以,token的动摇会按捺贸易的进行,也就不利于FIL的存储商场和检索商场的活泼。 那么有没有什么方法呢?有的,假如用FIL铸造一个安稳币,做成安稳币+FIL的双币体系,安稳币用于存储商场和检索商场,而FIL作为承载整个Filecoin的开展盈利,便可一箭双雕,可是现在还未见到Filecoin有如此的规划,需求进一步调查。 1.3、存储的法律危险 由于去中心化存储自带隐私功用,关于维护咱们个人隐私很有协助,可是反过来看,假如是存储的内容是不法内容,去中心化存储不就成为了某些犯罪分子的温床了吗? 现在来看,我国关于去中心化存储还处在默许其开展的阶段,主要还是由于Filecoin还处在纯挖矿阶段,还没有到商业运用阶段,所以不确定之后Filecoin能够真实存储内容后,我国的方针是否会强监管。 别的有一点也需求留意,现在国内开端打压PoW类的挖矿行为,为了满意碳达峰和碳中和的方针,尽管没有清晰表明要严打存储类挖矿,可是像北京等单个城市是也在严打存储挖矿的,往后,方针危险会是国内去中心化存储挖矿的一个达摩克利斯之剑。而海外,也有观念在讨论去中心化存储上的不法数据带来的社会危险,所以,如安在监管与隐私,中心化与去中心化之间找到一个平衡点,是去中心化存储的一大难题。
2.启示 2.1、IPFS正在成为趋势 IPFS的网络效应正在逐步形成,就好像是现在的许多新式公链都会兼容以太坊的虚拟机EVM相同,许多做去中心化存储的项目也会兼容IPFS,由于现在IPFS在去中心化存储方面有最大的一致,开发者和运用也最多,兼容IPFS能够在开发上削减重复造轮子的麻烦,也能够直接链接到很多开发工具和开发者,十分有利于开展生态。 不仅是区块链项目,就连传统互联网巨子也在纷繁布局IPFS,早在2019年,微软旗下的Azure Marketplace就发布了IPFS(beta)产品,该产品能够创立IPFS节点的权限网络,以形成去中心化的存储网络。除此之外,全球榜首视频渠道Netflix(网飞)、谷歌、华为云、京东、火狐、Opera阅读器、Brave阅读器也都表明做了IPFS相关的部署。 如此看来,好像IPFS真的在朝着替代HTTP协议的方向前进,提早布局IPFS会是掌握去中心化存储盈利的一大思路。 2.2、这个赛道仍有很多机会 从存储的机制上来说,去中心化存储能够极大的削减存储空间的糟蹋,光是这一点来看,这个赛道便是存储方法不行或缺的一种转变,而除了Filecoin以外,咱们也见到有许多新奇的思路,像ARweave和Crust便是依据IPFS做了别的一种思路的鼓励层,所以,咱们彻底有理由相信会有更多的鼓励层思路推出。更何况,这其间还能够依据鼓励层的规划思路,去定位为存储的细分范畴,比方ARweave更倾向于永久存储一些贵重的信息(或许NFT)。亦或许,相似Storj做成商业化的运用。 2.3、传统存储巨子入场的竞赛 正如前面所述,IPFS也招引了很多传统互联网巨子的留意,这会带来一些变化,一是他们会结合本身的需求去探索半商业半去中心化的方法去开展存储相关业务,二是他们会像Paypal等传统付出巨子入局加密钱银相同,当IPFS的商业落地被探索清楚之后,他们入局所带来的用户和资金量或许会一举超过之前去中心化存储在加密钱银范畴的堆集。这会对现有的去中心化存储项目带来竞赛的压力,但危中有机,这一起也带来另一个契机,由于有更多的资金和用户关注到这块了,能否把流量和资金招引过来,到时就要各凭本事了。 不行否定的是咱们正站在通往Web3.0的年代入口前,在这样一个大年代面前,数据存储作为重中之重的赛道必然会遭到很多人的关注。当然,咱们既能够是年代的参加者也能够是生态的建造者,如此,方能一起享遭到Web3开展带来的盈利。
No activity yet