# 去中心化存储：Arweave

By [N-sky](https://paragraph.com/@n-sky) · 2023-03-03

---

简评
--

Arweave是一个极具古典区块链精神的去存项目，将去中心化进行到极致，甚至很有可能成为去中心化抗审查的终极模式。项目的三个显著特色：**一是**，一次付费、永久存储、免费检索查阅，契合了当下公链、defi、NFT的需求痛点；**二是**，存储数据全部上链，独创区块纺模型及与之配套的SPoRA（简介随机访问证明）机制，保证了数据长期完整存储的同时，降低数据的冗余度；**三是**，独特的智能合约平台，将合约和状态信息同步存储，智能合约只在调用节点本地执行，大幅降低链上计算冗余，同时提供极强的抗审查性。

项目生态繁荣，应用端开发丰富；节点发展机制逐步优化调整。数据存储规模快速上量，但行业整体处于发展初期，整体存储规模还比较小。项目特点鲜明、生态蓬勃，值得重点关注。

1、代币经济学
-------

*   **AR 的总量**：6600万，在2018年6月8日的创世区块生成了 5500 万。
    
*   平均2分钟一个区块，创世块之后每个区块增发大约29个AR，增发量每年减半，最多增发 1100 万个 AR（出块奖励滞后2个月，估计是为了保证相关数据能在全网）
    
    *   第一个完整年份增发550万（2018.6.8-2019.6.8），每个区块增发29个
        
    *   第二个完整年份增发275万（2019.6.8-2020.6.8），每个区块增发14.5个
        
    *   第三个完整年份增发137.5万（2020.6.8-2021.6.8），每个区块增发7.25个
        
    *   第四个完整年份增发68.75万（2021.6.8-2022.6.8），每个区块增发3.625个
        
    *   第五个完整年份增发34.375万（2022.6.8-2023.6.8），每个区块增发1.8125个
        
    *   从挖矿的角度讲，基本都挖出来了。模型的通胀率非常低，约0.5%；考虑到协议的代币回收机制，**代币已经实质性进入通缩时代。**
        
*   **矿工收入：**
    
    *   一是，挖矿奖励，每两分钟一次
        
    *   二是，用户的存储支付（一般用AR支付），但这个存储支付中只有14%是给到矿工，另外86%交给协议的捐赠池（保证矿工能够长期存储数据-200年；**这个操作会较少市场流通量。所以，当存储量上来的时候，币价飞轮就启动了**）。
        
*   **存储定价机制**
    
    *   基本价格公式： 存储价格（以AR标记）= 通胀增速 / 难度增速。简单说，通胀越高，价格越高；难度越大，价格越低（参与挖矿的越多，单价越低）
        
    *   目前的价格是0.15AR/Gb（按目前AR市价10美元左右，大概在1.5美元/Gb）
        

2、共识机制
------

*   基本共识逻辑。不同于Filecoin等存储项目，将数据存储在资源节点，只有交易相关信息上链；AR将存储数据上链。但这就带来一个问题，如果类似传统区块链，每个节点存储全部区块数据，那AR上的每个节点就要存储每个客户的数据，这是不可能的。所以，AR并不是传统意义上的线性区块链，而是区块纺，只要求每个区块锁定一个前区块即可（每个区块后面可以跟N个区块）。每个节点如果需要存储新的客户数据，他需要在本地访问系统随机下发的一个区块（叫回忆区块），并证明他有这个区块并提交证明，他才有机会存储新的客户数据，所以原理上，你存储的会议块约多，你获得新的出块的机会就越大。每个节点都存有：1）全部节点的hash列表；2）全部的钱包列表；这样保证了检索和可验证性。
    
*   共识机制。1）开始是POA+POW，即提供随机访问证明（POA，系统提供随机区块-回忆块的访问需求，节点在本地提供访问者证明），然后辅助POW竞争，基本保证，谁存储的历史块多，谁获得POA的概率就越大。2）后来，改进成SPoRA （随机访问证明的简洁证明）（succinct proofs of random access ），削弱了POW的权重，加入了数据访问速度的作为考察因素（wildfire机制）。
    
*   Wildfire机制。为了保证检索和访问免费，同时方便回忆块在全网的均衡，采取了wildfire机制，通过节点之间相互评分实现。主要评价：1）节点的慷慨性，当我向你请求区块数据的时候，你给不给（保证访问）；2）你的访问速度怎么样（访问服务质量）。评分高的，下一次出块的几率就大。
    
*   数据访问免费。数据访问是免费的（相比FILECOIN ）有巨大的优势。访问数据的实际成本，基本就是该访问记录的存储成本，这个成本就非常低。Filecoin有专门的访问检索节点、存储节点还要提数据等，这些费用都和gas挂钩，如果交易量一旦大了gas上升很快，这个费用就会几何级的往上涨。
    
*   **生成新块，的具体流程：**
    
    *   假设系统上一个生成的区块是区块12，节点A存储了区块3、6，节点B存储了2、7
        
    *   系统提出的随机访问需求是回忆块是7，节点A就没有参与新区块生成的资格
        
    *   节点B本地存储了区块7，参与后续出块竞争
        
    *   结合节点B的POW及wildfire评分等，给出B是否有权出块的结果
        
    *   通过比拼节点B从竞争中胜出，获得记账权并出块13
        
    *   节点B将新的区块和recall block广播全网
        
    *   其他节点验证新的区块是否有效（包含区块的随机数符合POW以及区块中是否包含回忆块recall block的部分数据）
        
*   Arweave通过POA的方式可以实现均匀的将块分布在不同节点上，每次新块需要的recall block是随机的，一旦某个区块有较少节点存储那么拥有这个区块的节点获得记账权的概率就会变大，从而其他节点也来存储该区块。而如果按照均匀分布计算，某个区块丢失的概率为 (1-平均每个节点存储的区块数/网络中所有区块)^网络中节点数，由于网络中节点数不断增加，区块丢失概率非常之低。
    

3、关于智能合约
--------

Smartweave和通常意义上的智能合约不一样。一般意义上的智能合约，调用者是不执行，执行是全网节点的事情。但是，在AR上智能合约的执行是调用节点。这样的好处很明显，减少网络计算资源的消耗，执行效率会比较高；但问题在于，如何保证调用者的诚信？

Smartweave不仅仅将合约存在全网，还将初始状态和所有的交易记录存储在网络上，每次调用原则上，调用者从初始状态开始，重复所有交易记录，复原交易的最新状态，这个本身也是对前述交易的验证，从而保证了所有交易的真实性。但这同样会产生问题，随着时间的推移，历史数据会越来越多，调用者重复执行的消耗会越来越大，速度一定会越来越慢。

这个问题，是很多区块链项目都会遇到的问题。Smartweave引入了阶段性快照，提升执行的速度，调用人不需要从初始状态开始，而是选择一个合适、轻便的验证执行点。通过上述的方式，Smartweave大大减少了计算冗余、提升了合约的执行效率。

同时，Smartweave将程序、初始状态、执行记录、快照等全部进行去中心化存储，大大提升了区块链的抗审查性，甚至可以将DAPP的前端UI（一般是放在中心化服务器，UNI在2021年就是因为这个，也被SEC强制执行过）也放进全网存储，这样就具有了完美的抗审查性。

4、功能及应用生态
---------

已经开发出来的相关功能组件及生态应用：

*   Bundlr，打包上传，大大提供效率，类似二层网络的逻辑，目前是数据上传的主要方式
    
*   中间件kyve，专门针对公链（已经接入solana、cosmos、near、avalanche）
    
*   Ardive（ 对一般的文件、图片、媒体），用起来和dropbox一样方便
    
*   permaweb，提供前端网页托管、应用程序托管
    
*   ARconnect，类似钱包的用户界面
    
*   everpay，ar和eth之间的支付通路
    
*   evermore，自动同步工具，将本地文件自动同步在arweave
    
*   ar.io去中心化网关，（主要用于缓存，ar的确认时间是2分钟，对很多应用不友好，通过网关可以缓解）
    
*   生态：（截止2023年2月底，生态应用有100+）
    
    *   NFT，由koii network推出的基于AR的atomic.NFT标准（永久、便捷）
        
    *   文本创作，mirror
        
    *   音频NFT，pianity、releap等
        
    *   去中心化邮件：weve.mail \\ permamail.app
        
    *   去中心化论坛：metaweave
        
    *   permaswap，基于everpay的跨链swap
        

5、运行情况
------

*   目前存储的数据120T+，2022年一年存储数据74T（ 相比fil的450PB+，要小很多，但AR上客户需求真实性要高很多 ）
    
*   长期有效运行的节点100个左右，且单个节点规模目前还并不大
    
*   单节点运营状态简单分析
    
    2022年，总计存储74T的数据，每个节点平均存储不超过1T，按照1.5美元/G的价格，万网总收入大概11万美元；去年发币估计52万，10美元的价格，大概是520万美元。所以矿工收入以挖矿为主，大概530万。长期稳定矿池90多个，共享530万美元，基本上每个矿池6万美元/年。
    
    2T的固态硬盘价格，不超过1000元人民币。加上服务器、宽带的费用，节点应该也不会亏，但是想挣到像样的钱也很难。以2023年2月数据看，每天的存储量200G不到，对应客户提交收入不到3000美元（85%进储备库），目前增发量1305个。长期活跃的节点约100个（部分节点放弃），每个节点平均每天135美元，其实赚不到钱。按照每天200G，那么一年0.2\*365=73T（2022年全年74T）。关键还是需要。如果需求不起来，存储项目是没法做的。矿工的主要收入还是靠币。所以，同样，币减半的时候，币价必须上涨，否则大量矿工流失。
    
    但是，一旦业务起来，节点直接收入增加（客户支付），进储备库的AR也会增多，代币加速通缩，币价飞轮会启动。

---

*Originally published on [N-sky](https://paragraph.com/@n-sky/arweave)*