云储未来:Filecoin网络到底是怎么工作的？

今天来说一说，Filecoin网络到底是怎么工作的？

图片发自简书App

1、把单个文件拆分成若干个256KB大小的块（ block，这个就可以理解成扇区）；

2、逐块(block)计算block hash，hashn = hash ( blockn )；

3、把所有的block hash拼凑成一个数组，再计算一次hash，便得到了文件最终的hash，hash ( file ) = hash ( hash1……n )，并将这个 hash（file）和block hash数组“捆绑”起来，组成一个对象，把这个对象当做一个索引结构；

4. 把block、索引结构全部上传给IPFS节点（这里先不介绍细节），文件便同步到了IPFS网络了；

5. 把 Hash（filecoin）打印出来，读的时候用；

PS: 这里可以看出IPFS计算文件得到的hash，其实和我们平时计算hash的方式不一样，而且最终的结果也不一样！

工作室

这里还漏掉了一个小文件的处理逻辑，和NTFS等文件系统类似，小文件（小于 1KB）的文件，IPFS会把数据内容直接和Hash（索引）放在一起上传给IPFS节点，不会再额外的占用一个block的大小。

现在，已经把文件的原始数据和文件的索引（即hash）上传到IPFS网络了。前面已经讲过，IPFS是不支持空间回收的，文件一旦同步到IPFS，将永久的存在。看起来这样会招来一个严重的后果就是，如果频繁的编辑大文件，每编辑一次就要重新同步，岂不是会过度浪费空间？

举个例子：

本地有一个1G的大文件File1，已经同步到IPFS了，后面在这个文件File1后面追加了1K的内容，现在需要重新同步这个文件，算下来需要花费的空间应该是：1G+1G+1K；

然而，事实并非如此。IPFS在储存数据的时候，同一份数据只存储一次，文件是分块（block）存储的，hash相同的block，只会存储一次，也就说，前面1G的内容没有发生改变，其实IPFS并不会为这些数据分配新的空间，只会为最后1K的数据分配一个新的block，再重新上传hash，实际占用的空间是： 1G + 1K ;

不同的文件有很多数据是存在重复的，如不同语言字幕的电影，影音部分相同的，只有字幕部分不一样，当两个不同国家的人都在上传同一部电影的时候，这些文件在分块（block）的时候，很有可能有大部分block的hash是一致的，这些block在IPFS上也只会存储一份，这样一来就可能会有很多文件的索引指向同一个block，这里就构成了前面提到的一个数据结构——Merkle DAG（Merkle 有向无环图）。

詹纽瑞·琼斯

因为所有的索引上都保存了hash，所以Merkle DAG具有以下特点（从白皮书上扒下来的）：

1. 内容可寻址：所有内容都是被多重hash校验和来唯一识别的，包括links。

2. 无法篡改：所有的内容都用它的校验和来验证。如果数据被篡改或损坏，IPFS会检测到。

3. 重复数据删除：重复内容并只存储一次。

转载于:https://www.jianshu.com/p/a0937729ec6a

云储未来:Filecoin网络到底是怎么工作的？

猜你喜欢